千年先を見越したデータ保存方法

一昨年から東寺関係の古文書データベース化作業をおこなう科研に携わっている。

もちろん、私は日本中世史や古文書学には全く素人である。しかし、膨大な古文書と画像資料を簡便、かつ便利に検索でき、それが研究者やユーザの役に立つことができればいいと思っていたため、このグループに加わることになった。

東寺には様々な塔頭があり、資料館、大学図書館、個人などが所蔵した多数の文書集がある。これらは膨大であり、かつ目録も使い勝手が悪いため、該当資料を探し出すことに手間取るために、十分利用されているとは言い難い。そこで、これをなんとか最新の技術で便利にしたいと思っている。

古文書学の研究者は、膨大な時間をかけて、コツコツとデジタル化した個別データを作成しているが、それをデータベース化する技術を持ち合わせていない。そこで、私が知りあいの業者にデータの序列化やデータベース化の作業をしてもらうとうに依頼した。今日はその業者本社に寄って、システム構築の相談をした。

そこで、業者側が言ったのが、次の言葉だ。「データベース化の技術は今後どんどん発展していくので、たとえば異体字などをUnicodeとして認識する技術は今後開発されてくるだろう。したがって、データベース化作業よりも、それ以前にどの資料が別の資料(例えば、画像)とどう関連しているのかというリンクを張っておく作業をきっちりしておけば、千年先にでも検索できる。古文書という千年単位の文書や画像であれば、こうしたタイムスパンで考えるような仕事をしたい」と言った。この言葉に、同伴した古文書学者の目は一気に輝いた。「千年先まで検索可能になるというのはわれわれの専門では最もうれしい言葉である。是非取り組んでもらいたい」と話しはとんとん拍子に進んだ。

要は、データの項目、分類、類型化を将来的な拡張性を持った形にファイルを序列化し、関連するファイルをXML化する、ということである。私もXMLのことは詳しくないが、SGMLやその進化形であるXMLでリンクを張っておけば、たとえ千年後に現在のデータベースソフトが消滅したとしても、検索可能となる。

私の専門ではさすがに千年というタイムスパンで物を考えるということはないが、インターネットの技術はそうしたことを可能にする。正直言って私が過去に発表して現在まで通用しているのはそんなに多くない。

言語表現(日本語表現法)の提唱が1993年であるが、その当時主張していたことがここ数年再評価されて来ている。

もう一つは、1995年から五年間、ドイツの大学とインターネットを活用したe-learningを実践したことがわが国の文科系において、海外とのe-learningの実践では最初の試みである。京都大学高等教育研究開発推進センター編「大学教育学」培風館, 2003は、そういう評価をおこなっている。

大学教育学

大学教育学

  • 作者: 京都大学高等教育研究開発推進センター
  • 出版社/メーカー: 培風館
  • 発売日: 2003/12
  • メディア: 単行本

千年まではとても及ばないが、10年間は意味があったことは名誉なことである。さらに長く評価されるように精進したいと思う。

カテゴリー: 未分類 パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください