学部後期課程
HOME 学部後期課程 データマイニング概論
学内のオンライン授業の情報漏洩防止のため,URLやアカウント、教室の記載は削除しております。
最終更新日:2024年10月18日

授業計画や教室は変更となる可能性があるため、必ずUTASで最新の情報を確認して下さい。
UTASにアクセスできない方は、担当教員または部局教務へお問い合わせ下さい。

データマイニング概論

データマイニング概論
ビックデータ分析技術は情報処理技術を学ぶ上で重要となっている。本授業では、データ分析・データマイニングの基礎について学ぶとともに演習を通して実際にデータを分析するプロセスを学ぶ。後期課程や大学院におけるデータサイエンス、人工知能、機械学習、自然言語処理などの関連授業の基礎となる知識を習得することを目標とする。
MIMA Search
時間割/共通科目コード
コース名
教員
学期
時限
0590105
FSC-CC3A18L1
データマイニング概論
森 純一郎
A1 A2
月曜5限
マイリストに追加
マイリストから削除
講義使用言語
日本語
単位
2
実務経験のある教員による授業科目
NO
他学部履修
開講所属
理学部
授業計画
第1回目はガイダンスおよび全体の概論を説明する。 以降、以下の内容について授業を進める。授業全体の最後には学習した内容に基づきミニプロジェクトを行う。 確率・統計、線形代数、解析、最適化などの必要な数学的知識は具体的な手法と織り交ぜて都度説明する。 1. ガイダンス 2. データ分析のためのプログラミング基礎1: Pythonの基礎 3. データ分析のためのプログラミング基礎2: Numpy, Scipy, Pandas, Matplotlibなどのモジュール 4. データの記述統計・前処理: 記述統計、分布、最尤法、欠損値・外れ値の処理など 5. テキストデータ分析: tfidf、ベクトル空間モデル、形態素解析、類似度、潜在意味解析など 6. ネットワーク分析: 隣接行列, 最短距離, 中心性、コミュニティ抽出、ネットワークの数理モデルなど 7. 機械学習の基礎(教師なし学習): k-means、階層化クラスタリング 8. 機械学習の基礎(教師なし学習): EMアルゴリズム、主成分分析 9. 機械学習の基礎(教師あり学習): 線形回帰、ロジスティック回帰 10. 機械学習の基礎(教師あり学習): 過学習と正則化、モデル評価と選択 11. データ分析の実践 12. 深層学習の基礎:多層パーセプトロン、誤差逆伝搬法、最適化など 13. 畳み込みニューラルネットワークと画像処理応用 14. Self-Attention・Transformersと言語処理応用 15. ゲスト講義
授業の方法
スライドと板書を用いた講義とプログラミング演習を行う。講義資料、プログラミング演習資料と課題は授業中に指定するウェブサイトに公開する。
成績評価方法
複数回の中間課題ならびに最終課題によって評価する。
教科書
「Pythonデータ解析入門」 東京大学出版会
参考書
授業中に推薦書を適宜指示する。
履修上の注意
履修にあたっては、高校数学の知識を前提とする。必須ではないが、Pythonの基礎とJupyterノートブック(Google Colaboratory)の使い方を理解していることが望ましい。数理・データサイエンス教育プログラムの「Pythonプログラミング入門」と同等の内容を理解しているのが望ましい。 予習として教材の単元箇所を予め読むこと。復習として演習の確認問題に取り組むこと。