学部後期課程
HOME 学部後期課程 データマイニング概論
学内で開催されるオンライン授業の情報漏えい防止のため,2021年9月17日以降は授業カタログの更新を見合わせています

データマイニング概論

データマイニング概論
ビックデータ分析技術は情報処理技術を学ぶ上で重要となっている。本授業では、データ分析・データマイニングの基礎について学ぶとともに演習を通して実際にデータを分析するプロセスを学ぶ。後期課程や大学院におけるデータサイエンス、人工知能、機械学習、自然言語処理などの関連授業の基礎となる知識を習得することを目標とする。
MIMA Search
時間割/共通科目コード
コース名
教員
学期
時限
0590105
FSC-CC3A16L1
データマイニング概論
森 純一郎
A1 A2
月曜5限
マイリストに追加
マイリストから削除
教室
理学部1号館東棟 285講義室(NSSOL Learning Studio)
講義使用言語
日本語
単位
2
実務経験のある教員による授業科目
NO
他学部履修
開講所属
理学部
授業計画
第1回目はガイダンスおよび全体の概論を説明する。以降、以下の内容について授業を進める。授業全体の最後には学習した内容に基づきミニプロジェクトを行う。確率・統計、線形代数、解析、最適化などの必要な数学的知識は具体的な手法と織り交ぜて都度説明する。 1. ガイダンス、データ分析のためのプログラミング基礎1: Pythonの基礎 2. データ分析のためのプログラミング基礎2: Numpy, Scipy, Pandas, Matplotlibなどのモジュール 3. データの記述統計・前処理: 記述統計、分布、最尤法、欠損値・外れ値の処理など 4. テキストデータ分析: tfidf、ベクトル空間モデル、形態素解析、類似度、潜在意味解析など 5. ネットワーク分析: 隣接行列, 最短距離, 中心性、コミュニティ抽出、ネットワークの数理モデルなど 6. 機械学習の基礎(教師なし学習): k-means、階層化クラスタリング 7. 機械学習の基礎(教師なし学習): EMアルゴリズム、主成分分析 8. 機械学習の基礎(教師あり学習): 線形回帰、ロジスティック回帰 9. 機械学習の基礎(教師あり学習): 過学習と正則化、モデル評価と選択 10. データ分析の実践 11. 深層学習の基礎:多層パーセプトロン、誤差逆伝搬法、最適化など 12. 畳み込みニューラルネットワークと画像処理応用 13. 再帰的ニューラルネットワークと言語処理応用
授業の方法
スライドと板書を用いた講義と履修者のノートPCを使用したプログラミング演習を行う。講義資料、プログラミング演習資料と課題は授業中に指定するウェブサイトに公開する。
成績評価方法
各回のプログラミング課題、ミニプロジェクト、クイズによって評価する。
教科書
必須の教科書はないが以下の書籍を推薦する。 The Hundred-Page Machine Learning Book Andriy Burkov(著) Oxford Univ Press ISBN-10: 0198805098 Machine Learning: A Probabilistic Perspective Kevin P. Murphy (著) The MIT Press ISBN-10: 0262018020 統計的自然言語処理の基礎 Christopher D. Manning (著),‎ Hinrich Sch¨utze (著),‎ 加藤 恒昭 (翻訳),‎ 菊井 玄一郎 (翻訳) 共立出版 ISBN-10: 4320124219 Networks: An Introduction M. E. J. Newman (著) Oxford Univ Press ISBN-10: 0198805098
参考書
授業中に推薦書を適宜指示する。
履修上の注意
履修にあたっては、高校数学の知識を前提とする。必須ではないが、Pythonの基礎とJupyterノートブックの使い方を理解していることが望ましい。数理・データサイエンス教育プログラムの「Pythonプログラミング入門」と同等の内容を理解しているのが望ましい。