人文学のTEI入門
2022-08-09 14:02:16
日本の人文学研究を支えるTEIガイドライン入門書が刊行されました
日本の人文学研究を開く新たな一歩
日本の人文学において著しい発展が期待される中、初めて日本語でのTEI(Text Encoding Initiative)ガイドラインに準拠した入門書、『人文学のためのテキストデータ構築入門』が刊行されました。本書は株式会社文学通信によって発行され、今後の人文学研究に大きな影響を与えることが期待されています。
TEIガイドラインとは
TEIガイドラインは人文学研究におけるデファクトスタンダードとして国際的に普及しており、特に欧米の先進国においては、広範なテキストデータの蓄積があります。しかし、日本語文化圏では、さまざまな要因からこの普及が進んでいませんでした。
日本では、関連する情報がWeb上に点在しているものの、実用的なテキストデータの構築を始めるステップや、効率的に習得する手法についての明確な指針が求められていました。そこで、本書はそのニーズに応え、TEIガイドラインに基づく実践的な手法を体系的に学べるようにまとめられています。
本書の構成
本書は全4部から成り立っており、それぞれの部で異なる視点からのアプローチが紹介されています。
第1部 概説編
この部では、人文学におけるテキストデータ作成の重要性や、歴史的背景が詳述されています。特にTEIガイドラインの成立過程と、これが人文学研究にどのように寄与しているのか、という視点が強調されています。
第2部 実践編
実践編では、手書き文書をデジタル化するための最先端技術が紹介され、Transkribusを用いた手書きテキストの自動翻刻法が提供されています。さらに、受講者は実際に夏目漱石の書簡を用いて、TEIを基にしたテキスト構造化も体験できます。ここでは、データ作成の基本的な考え方と、コンピューティングの知識が学べるように工夫されています。
第3部 事例編
様々な事例研究を通じ、TEIガイドラインの適用例が紹介されています。古辞書や財務史料に加え、自動人名抽出の手法に関する研究も取り上げられ、実際の研究成果がどのように活用されているのかが示されています。
第4部 事例編
大正新修大蔵経のTEI構造化など、大規模なマークアップ試行も紹介され、古文書のデジタル化に向けた具体的な取り組みが紹介されています。これにより、多様な資料に対するTEIガイドラインの適用可能性が広がることが期待されます。
本書の狙いと未来
本書は決して全てを網羅するものではありませんが、今後人文学研究を行う上での旅の第一歩として位置付けられています。読者はこの本を通じて、TEIガイドラインを活用したテキストデータ構造化に挑戦するための導入を得られるでしょう。
今後、日本の人文学研究がより多様で開放的に進化し、世界中に展開されることが期待されており、本書がその枠組みとして機能することに期待が寄せられています。
この画期的な出版物は、文学通信によって提供され、詳細は公式ウェブサイト(https://bungaku-report.com/)で確認できます。
会社情報
- 会社名
-
株式会社文学通信
- 住所
- 東京都北区東十条1-18-1東十条ビル1-101
- 電話番号
-
03-5393-9027