学部後期課程
HOME 学部後期課程 データサイエンス超入門
過去(2022年度)の授業の情報です
学内のオンライン授業の情報漏洩防止のため,URLやアカウント、教室の記載は削除しております。
最終更新日:2024年8月27日

授業計画や教室は変更となる可能性があるため、必ずUTASで最新の情報を確認して下さい。
UTASにアクセスできない方は、担当教員または部局教務へお問い合わせ下さい。

データサイエンス超入門

データサイエンスに関する社会状況などの周囲状況およびデータサイエンスの技術概要、特に、データサイエンスに関わる統計・機械学習の概要を講義する。講義で紹介された統計・機械学習手法を用いて、分類や予測・回帰問題をR(またはpython)のプログラミングにより解く。これにより、データサイエンスの概要を把握・学習し、データサイエンスの中核技術に関する基本的レベルの修了を目標とする。プログラミングに習熟していない学生には「Rの初歩」(第1回授業)により、Rの初歩的プログラミングを指導する。授業においては、Rを主体とするが、pythonによるプログラミングを指向する学生のために、例題・演習などについては、pythonについても回答例を提供する。課題回答はpythonによるものも認める。
MIMA Search
時間割/共通科目コード
コース名
教員
学期
時限
FEN-CO3d20L1
FEN-CO3d20L1
データサイエンス超入門
齋藤 洋
S1
火曜5限
マイリストに追加
マイリストから削除
講義使用言語
日本語
単位
1
実務経験のある教員による授業科目
NO
他学部履修
開講所属
工学部
授業計画
105分授業。 1)「Rの初歩」(第1回授業) 必要なRに関する最小限の知識を習得するために行う。 予習をし、例題、練習問題をやってくる。 できなかった部分についてのみ、授業で対応する。 RでのプログラムをRに精通する学生、pythonによりプログラミング行う学生は、必ずしも受講の必要はない。 Rのインストールがうまくできない学生への対応も行う。 2)座学(第2-6回授業) データサイエンスの背景 商用化・産業化動向 社会的影響 構成技術・概念 統計の代表的手法 機械学習の代表的手法 など 主要トピックごとに、プログラミングを行う。 第5回では、手書き数字認識などの練習問題を行うことがある。 3)統計・機械学習演習(第(6,)7回授業) ITC-LMS上に用意されたデータセットに対して、統計・機械学習の代表的手法のRまたはpythonのプログラムを作成し適用してみる。その際、Rのプログラミングに精通していない学生は、 ITC-LMS上に用意されたtemplate.r、functions.rを用いることで、 Rのプログラミングの負担を減らすことができる。分類や回帰の問題に対して適用すべき、適用できる手法を体験し、違いを認識する。各手法におけるパラメータ(例えば、ニューラルネットの層数)や事前処理(例えば、変数の正規化)の有無の影響を体験する。
授業の方法
ノートパソコンを持たない学生は事前に相談すること。ITC-LMSの利用トラブルなどは、事前に申し出る。 ITC-LMS上にある「データサイエンス超入門 受講の準備」を読んで、事前に、所定のデータ類やプログラムのダウンロード、Rを用いる学生はRのインストールを行うこと。これらがうまくいかない場合は、事前に申し出ること。packageのインストールで失敗する受講生もいるが、これについては、第1回授業で対応する。予習して、第1回授業に臨むこと。R本体のインストールができれば、第1回授業の予習は可能である。 pythonを用いる学生は各自pythonのインストールなどを行うこと。pythonについては、これらを自分でできていることが前提となる。
成績評価方法
課題レポートによる。課題を提出しない場合は、原則、「未受験」ではなく、「不可」とする。
教科書
講義資料に記載
履修上の注意
基礎を固める(工学部共通)
その他
前提となる知識と項目:機械学習、AIなどを含むデータサイエンスを専門と「しない」学生、数理・情報に関する経験が乏しい学生を歓迎する。 文理を問わないが,駒場前期課程の文系向け数学科目、数学I(1変数微積)、数学II(ベクトル,行列の基礎)程度の数学知識は前提とする。 プログラミング経験は不要であるが、与えられたプログラムをノートパソコン上で動作させることができる程度のコンピュータ経験が必要。Rの初歩、たとえば、小池先生の統計データ解析 I の最初の4回の講義(https://ocwx.ocw.u-tokyo.ac.jp/***** で提供されている)を受講していると有益である。pythonについては、Pythonプログラミング入門の受講が望ましい。