学部後期課程
HOME 学部後期課程 データマイニング入門
過去(2018年度)の授業の情報です
学内のオンライン授業の情報漏洩防止のため,URLやアカウント、教室の記載は削除しております。
最終更新日:2024年4月22日

授業計画や教室は変更となる可能性があるため、必ずUTASで最新の情報を確認して下さい。
UTASにアクセスできない方は、担当教員または部局教務へお問い合わせ下さい。

データマイニング入門

データマイング入門 (Introduction to Data Science)
ビックデータ分析技術は情報処理技術を学ぶ上で重要となっている。本講義では、データ分析・データマイニングの基礎について学ぶとともに演習を通して実際にデータを分析するプロセスを学ぶ。特に、前期課程の「データマイニング入門」講義のさらに発展的な内容を学習することで、後期課程や大学院におけるデータサイエンス、人工知能、機械学習、自然言語処理などの関連講義の基礎となる知識を習得することを目標とする。
MIMA Search
時間割/共通科目コード
コース名
教員
学期
時限
0590103
FSC-CC3A16L1
データマイニング入門
森 純一郎
A1 A2
水曜5限
マイリストに追加
マイリストから削除
講義使用言語
日本語
単位
2
実務経験のある教員による授業科目
NO
他学部履修
開講所属
理学部
授業計画
第1回目はガイダンスおよび全体の概論を説明する。以降、以下の内容について授業を進める。講義全体の最後には学習した内容に基づきミニプロジェクトを行う。 ・データ分析のためのPythonプログラミング:Pythonの基本的な文法とNumpy, Scipy, Pandas, Matplotlibなどの科学技術計算のための主要なモジュールについて ・データ分析のための数理的基礎:記述統計、分布、検定、ベクトル・行列、固有値分解、最適化基礎などについて ・データの前処理・加工とデータベース:サンプリングと信頼区間、欠損値・ノイズ・外れ値の処理、関係データベースなどについて ・テキストデータ分析の基礎:tfidf、Bag of Words、ベクトル空間モデル、形態素解析、類似度、潜在意味解析などについて ・ネットワーク・グラフデータ分析の基礎:接続行列, 最短距離, クラスタリング係数, 中心性、コミュニティ抽出、ネットワークの数理モデルなどについて ・時系列データ分析の基礎:確率過程基礎、自己回帰移動平均モデルとその一般化などについて ・データマイニングの基礎:相関ルール、頻出パターン、決定木、ナイーブベイズなどについて ・機械学習の基礎(教師あり学習):k-NN、線形回帰、ロジスティック回帰、正則化、モデル選択などについて ・機械学習の基礎(教師なし学習):k-means、階層化クラスタリング、EMアルゴリズムなどについて ・データの可視化:主成分分析、多次元尺度構成法、t-SNEなどについて
授業の方法
スライドと板書を用いた講義と履修者のノートPCを使用した演習を行う。講義資料および演習資料と課題は講義中に指定するウェブサイトに公開する。
成績評価方法
出席と講義中の演習の結果ならびにミニプロジェクトのレポート内容によって評価する。
教科書
必須の教科書はないが以下の書籍を推薦する。 Machine Learning: A Probabilistic Perspective Kevin P. Murphy (著) The MIT Press ISBN-10: 0262018020 統計的自然言語処理の基礎 Christopher D. Manning (著),‎ Hinrich Sch¨utze (著),‎ 加藤 恒昭 (翻訳),‎ 菊井 玄一郎 (翻訳) 共立出版 ISBN-10: 4320124219 Networks: An Introduction M. E. J. Newman (著) Oxford Univ Press ISBN-10: 0199206651
参考書
プリントを配布するとともに講義中に推薦書を適宜指示する。
履修上の注意
履修にあたっては、高校数学の知識を前提とする。必須ではないが、Pythonの基礎とJupyterノートブックの使い方を理解していることが望ましい。また、前期課程の「データマイニング入門」および後期課程の「Pythonプログラミング入門」を受講しているのが望ましい。