前半は座学講義として概ね下記の内容で進めます。
初回ガイダンスはオンラインで実施します。
1. ガイダンス
2. テキスト統計量
3-4. テキスト分類(最尤推定、確率分布、ナイーヴベイズ分類)
5-7. 系列ラベリング・クラスタリング(隠れマルコフモデル、EMアルゴリズム、k-means、混合ガウスモデル)
8. 暗号文書解読の統計モデル
9. ニューラル言語モデル
後半は、「確率的言語学」に関する洋書1冊に対して、各受講生またはグループに1章分の全訳を担当していただき、それに基づいた内容発表を課す予定です。受講生の希望に応じて、論文や他の書籍に変更することも考えます。あるいは、民間企業の研究者を招待して、ハッカソンのような演習実験も検討しています。
授業後半は受講者に応じて、柔軟に内容を変える予定です。