大学院
HOME 大学院 人文情報学研究I
学内のオンライン授業の情報漏洩防止のため,URLやアカウント、教室の記載は削除しております。
最終更新日:2024年10月18日

授業計画や教室は変更となる可能性があるため、必ずUTASで最新の情報を確認して下さい。
UTASにアクセスできない方は、担当教員または部局教務へお問い合わせ下さい。

人文情報学研究I

人文学のためのデータ構造化
人文学におけるこれまでの研究は、紙媒体を前提として長く育まれてきた膨大な暗黙知によって成立し発展してきた。この暗黙知を意識する必要が出てきたのはデジタル媒体を避けて通れない状況が現出したからに他ならない。欧米ではすでに30年にわたるTEI(Text Encoding Initiative)ガイドラインへの取り組みにより、西洋中世写本研究から言語コーパスに至るまで、テキストに内在する暗黙的な構造を明らかにしてデジタル媒体へと還元してきており、欧米で発展するデジタル・ヒューマニティーズにおける「方法論のコモンズ(Methodological Commons)」という基本理念を体現してきた。一方、日本をはじめとする非欧米文化圏の人文学は未だこの動向への参画が決して十分とは言えず、ここから学び得ることは少なくない。

また、ウェブを中心としたデジタル学術情報基盤の世界では、研究データや資料を相互に接続し知識基盤を構築する枠組みとしてRDF(Resource Description Framework)が浸透しつつあり、さらに、専門分野における概念同士の関係性や人物・地名の関係といった知識の記述自体にもこれを用いようとする動きが広まりつつある。

一方、コンピュータを用いた大規模なデータの管理や利用には関係データベース(Relational Database: RDB)が広く用いられてきた。各種のデジタルアーカイブやウェブサービスの多くはRDBに支えられており、技術者の層も厚い。表形式のデータに対して柔軟かつ高速な絞り込みや演算を行うことができるRDBは、人文学研究においても有用である。

本授業では、人文学がこれまで積み重ねてきたデジタル技術による暗黙知の明示的構造化の状況について理解する。次に、RDB、TEIガイドラインとその基盤技術であるXML、RDFの各技術を概説し、資料や知識を構造化する枠組みを習得する。これらにより、洋の東西や分野の違いを問わず、デジタル媒体を前提とした研究環境へと適切に対応するための基礎を涵養することを目指す。
MIMA Search
時間割/共通科目コード
コース名
教員
学期
時限
21240093
GHS-XX6A01L1
人文情報学研究I
大向 一輝
S1 S2
金曜2限
マイリストに追加
マイリストから削除
講義使用言語
日本語
単位
2
実務経験のある教員による授業科目
NO
他学部履修
開講所属
人文社会系研究科
授業計画
本授業では、まず、データの構造化の基本的な考え方について学び、表形式のデータを対象としたRDB、マークアップ言語として広く用いられているXMLの基本を習得した上で、TEIガイドラインの学習に進む。RDFに関しては、ウェブにおける知識表現の観点から基本的な考え方とその実際について学ぶ。 いずれの技術も他の技術・規格とも密接に関連しており、それらについては、受講生の関心に応じて適宜採り上げる。 また、構造化資料は視覚化技術と密接に結びついており、視覚化は構造化の意義を明らかにする手段の一つでもある。本授業においても、構造化の意義を確認することを目指し、簡便に活用可能ないくつかの視覚化手法を扱う。 1. イントロダクション:データの構造化とは 2. RDBの基礎(テーブル構造) 3. RDBの基礎(SQLなど) 4. RDBの応用・XMLの基礎(ツリー構造) 5. TEIの基礎(人文学テキストに必要な要素とその付与) 6. TEIの基礎(外部要素とのリンク) 7. TEIの応用(テキストの利活用) 8. XSLTの基礎(要素の指定と変換) 9. XSLTの応用(テキストの利活用) 10. RDFの基礎(グラフ構造・URI) 11. RDFの基礎(スキーマ・語彙・SPARQL) 12. RDFの応用(Linked Open Data・知識グラフ)
授業の方法
ハイブリッド形式で実施する。講義と実習の組み合わせとなる。実習については、授業で配布するソフトウェアを用いて実際に構造化に取り組む。したがって、受講生はWindows・Mac・Linux等が動作するノートパソコンを授業に持参すること。またオンライン接続環境も必須である。
成績評価方法
実習の成果、及び期末レポートを以て成績評価を行う。
教科書
人文情報学研究所監修『人文学のためのテキストデータ構築入門 TEIガイドラインに準拠した取り組みにむけて』(文学通信)
参考書
Nancy Ide, C. Michael Sperberg-McQueen, Lou Burnard, 「TEI:それはどこからきたのか。 そして、なぜ、今もなおここにあるのか?」『デジタル・ヒューマニティーズ』2018年12月, pp. 3-28. https://doi.org/***** 後藤真・橋本雄太編『歴史情報学の教科書 歴史データが世界をひらく』(文学通信) 京都大学人文科学研究所共同研究班編『日本の文化をデジタル世界に伝える』(樹村房) 下田正弘・永崎研宣編『デジタル学術空間の作り方』(文学通信)
履修上の注意
受講生はWindows・Mac・Linux等が動作するノートパソコンを授業に持参すること。またオンライン接続環境も必須である。
その他
下記のサイトも適宜参照のこと https://www.tei-c.org/***** (TEI P5 ガイドライン) https://wiki.tei-c.org/***** (TEI協会東アジア/日本語分科会) https://teach.dariah.eu/***** (西洋中世写本構造化のMOOC)