第1回目はガイダンスおよび全体の概論を説明する。以降、以下の内容について授業を進める。授業全体の最後には学習した内容に基づきミニプロジェクトを行う。確率・統計、線形代数、解析、最適化などの必要な数学的知識は具体的な手法と織り交ぜて都度説明する。
1. ガイダンス、データ分析のためのプログラミング基礎1: Pythonの基礎
2. データ分析のためのプログラミング基礎2: Numpy, Scipy, Pandas, Matplotlibなどのモジュール
3. データの記述統計・前処理: 記述統計、分布、最尤法、欠損値・外れ値の処理など
4. テキストデータ分析: tfidf、ベクトル空間モデル、形態素解析、類似度、潜在意味解析など
5. ネットワーク分析: 隣接行列, 最短距離, 中心性、コミュニティ抽出、ネットワークの数理モデルなど
6. 機械学習の基礎(教師なし学習): k-means、階層化クラスタリング
7. 機械学習の基礎(教師なし学習): EMアルゴリズム、主成分分析
8. 機械学習の基礎(教師あり学習): 線形回帰、ロジスティック回帰
9. 機械学習の基礎(教師あり学習): 過学習と正則化、モデル評価と選択
10. データ分析の実践
11. 深層学習の基礎:多層パーセプトロン、誤差逆伝搬法、最適化など
12. 畳み込みニューラルネットワークと画像処理応用
13. 再帰的ニューラルネットワークと言語処理応用