学部後期課程
HOME 学部後期課程 データサイエンス超入門
過去(2020年度)の授業の情報です
学内のオンライン授業の情報漏洩防止のため,URLやアカウント、教室の記載は削除しております。
最終更新日:2024年4月22日

授業計画や教室は変更となる可能性があるため、必ずUTASで最新の情報を確認して下さい。
UTASにアクセスできない方は、担当教員または部局教務へお問い合わせ下さい。

データサイエンス超入門

データサイエンスに関する社会状況などの周囲状況およびデータサイエンスの技術概要、特に、データサイエンスに関わる統計・機械学習の概要を講義する。講義で紹介された統計・機械学習手法を用いて、分類や予測・回帰問題をRのプログラミングにより解く。これにより、データサイエンスの概要を把握・学習し、データサイエンスの中核技術に関する基本的レベルの修了を目標とする。
MIMA Search
時間割/共通科目コード
コース名
教員
学期
時限
FEN-CO3d20L1
FEN-CO3d20L1
データサイエンス超入門
齋藤 洋
S1
火曜5限
マイリストに追加
マイリストから削除
講義使用言語
日本語
単位
1
実務経験のある教員による授業科目
NO
他学部履修
開講所属
工学部
授業計画
1)「Rの初歩」(第1回授業) 必要なRに関する最小限の知識を習得するために行う。   予習をし、例題、練習問題をやってくる。 何らかの事情で予習できなかった場合は、必ず、復習・自習し、次週以降のプログラミング例題をこなせるようにする。 RでのプログラムをRに精通する学生は、必ずしも受講の必要はない。 2)座学(第2-5回授業) データサイエンスの背景 商用化・産業化動向 社会的影響 構成技術・概念 統計の代表的手法 機械学習の代表的手法 など 主要トピックごとに、Rでのプログラミングを行う。 第5回では、Rによる手書き数字認識などの練習問題を行うことがある。 3)統計・機械学習演習(第6,7回授業) ITC-LMS上に用意されたデータセットに対して、統計・機械学習の代表的手法のRによるプログラムを作成し適用してみる。その際、Rのプログラミングに精通していない学生は、 ITC-LMS上に用意されたtemplate.r、functions.rを用いることで、 Rのプログラミングの負担を減らすことができる。分類や回帰の問題に対して適用すべき、適用できる手法を体験し、違いを認識する。各手法におけるパラメータ(例えば、ニューラルネットの層数)や事前処理(例えば、変数の正規化)の有無の影響を体験する。
授業の方法
ノートパソコンを持たない学生は事前に相談すること。 ITC-LMS上にある「データサイエンス超入門 受講の準備」を読んで、事前に、所定のデータ類やプログラムのダウンロード、Rのインストールを行うこと。これらがうまくいかない場合は、事前に申し出ること。予習して、第1回授業に臨むこと。R本体のインストールができれば、第1回授業の予習は可能である。 オンライン授業、プログラミングに関するトラブルは、ITC-LMSの機能を使って連絡する。
成績評価方法
課題レポートによる。課題レポートに加えて、授業中に出す練習問題についてのレポート提出を指示することがある。
履修上の注意
基礎を固める(分野別基礎)
その他
前提となる知識と項目:機械学習、AIなどを含むデータサイエンスを専門と「しない」学生、数理・情報に関する経験が乏しい学生を歓迎する。 文理を問わないが,駒場前期課程の文系向け数学科目、数学I(1変数微積)、数学II(ベクトル,行列の基礎)程度の数学知識は前提とする。 プログラミング経験は不要であるが、与えられたRのプログラムをノートパソコン上で動作させることができる程度のコンピュータ経験が必要。Rの初歩、たとえば、小池先生の統計データ解析 I の最初の4回の講義(https://ocwx.ocw.u-tokyo.ac.jp/***** で提供されている)を受講していると有益である。