時系列史料の人機分担構造化:古典籍『武鑑』を参照する江戸情報基盤の構築に向けて
書誌事項
- タイトル別名
-
- Structuring Time-Series Historical Sources by Human-Machine Specialization: Toward the Construction of Edo Information Platform Referring to “Bukan”
抄録
本論文は古典籍「武鑑」を対象として,大規模データを構造化するための全く新しいワークフローを提案する.まず「武鑑」を時間的に連続して変化する「時系列史料」という新しい種類の史料と捉え,そこから生み出される多数のバージョンをソフトウェア工学の観点から解釈し,これを板本書誌学の概念と対応させる.次にバージョン間の差分を検出する方法としてテキストベースと画像ベースのアプローチを比較し,「武鑑」では特に画像ベース差分検出が有効であることを示す.さらに差分検出と差分翻刻を合わせたアプローチを「差読」と呼び,そのためのワークフローを「人機分業」として構築することが「武鑑」の構造化の鍵を握ることを論じる.その最初の成果を「武鑑全集」として2017年11月に公開した.
This paper proposes a new workflow for structuring large-scale data, such as Pre-modern Japanese text “Bukan.” First, we define “Bukan” as a new type of historical sources called “time-series sources” that changes continuously over time, and interpret many versions associated with “Bukan” from the viewpoint of software engineering and make a mapping of those versions to the concepts of bibliography of Japanese old printed books. We then compare text-based and image-based approaches to the detection of difference, and propose a new concept “differential reading” that combines both the detection of difference, and differential transcription, to realize a workflow based on human-machine specialization, which is a key toward structuring “Bukan” The first preliminary result was released as “Bukan Complete Collection” on November 2017.
収録刊行物
-
- じんもんこん2017論文集
-
じんもんこん2017論文集 2017 273-280, 2017-12-02
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050292572095015168
-
- NII論文ID
- 170000176259
-
- Web Site
- http://id.nii.ac.jp/1001/00184666/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles