第1回目はガイダンスおよび全体の概論を説明する。以降、以下の内容について授業を進める。講義全体の最後には学習した内容に基づきミニプロジェクトを行う。
・データ分析のためのPythonプログラミング:Pythonの基本的な文法とNumpy, Scipy, Pandas, Matplotlibなどの科学技術計算のための主要なモジュールについて
・データ分析のための数理的基礎:記述統計、分布、検定、ベクトル・行列、固有値分解、最適化基礎などについて
・データの前処理・加工とデータベース:サンプリングと信頼区間、欠損値・ノイズ・外れ値の処理、関係データベースなどについて
・テキストデータ分析の基礎:tfidf、Bag of Words、ベクトル空間モデル、形態素解析、類似度、潜在意味解析などについて
・ネットワーク・グラフデータ分析の基礎:接続行列, 最短距離, クラスタリング係数, 中心性、コミュニティ抽出、ネットワークの数理モデルなどについて
・時系列データ分析の基礎:確率過程基礎、自己回帰移動平均モデルとその一般化などについて
・データマイニングの基礎:相関ルール、頻出パターン、決定木、ナイーブベイズなどについて
・機械学習の基礎(教師あり学習):k-NN、線形回帰、ロジスティック回帰、正則化、モデル選択などについて
・機械学習の基礎(教師なし学習):k-means、階層化クラスタリング、EMアルゴリズムなどについて
・データの可視化:主成分分析、多次元尺度構成法、t-SNEなどについて