言語科学特殊講義（１） - 教養学部 - 東京大学授業カタログ

言語科学特殊講義（１）

自然言語処理

自然言語処理を主な対象分野として、近年の大規模言語モデルに至るまでの基礎を講義します。
人文系でも使用実績のある教科書を基にして講義しますので、文科系の方でも受講いただけます。
初回ガイダンスはオンラインで実施します。

MIMA Search

授業計画

前半は座学講義として概ね下記の内容で進めます。初回ガイダンスはオンラインで実施します。 1. ガイダンス 2. テキスト統計量 3-4. テキスト分類（最尤推定、確率分布、ナイーヴベイズ分類） 5-7. 系列ラベリング・クラスタリング（隠れマルコフモデル、EMアルゴリズム、k-means、混合ガウスモデル） 8. 暗号文書解読の統計モデル 9. ニューラル言語モデル後半は、「確率的言語学」に関する洋書1冊に対して、各受講生またはグループに1章分の全訳を担当していただき、それに基づいた内容発表を課す予定です。受講生の希望に応じて、論文や他の書籍に変更することも考えます。あるいは、民間企業の研究者を招待して、ハッカソンのような演習実験も検討しています。授業後半は受講者に応じて、柔軟に内容を変える予定です。

授業の方法

書籍・論文等の内容紹介、あるいは、ハッカソンによる成果発表を行う。前者の場合、全訳の提出とプレゼンテーションを行っていただく予定です。後者の場合、プレゼンテーションのみで考えています。（グループまたは個人）

成績評価方法

発表100% （発表担当回以外では出席を取りません）

履修上の注意

発表形式は受講生の人数に応じて決定しますが、前年度のように20名近い受講生がいた場合はグループ分けを考えます。