第3回 中編

第3回前編からつづく)

「今回の改訂では冊子書籍での刊行ができるかわからない。となると印刷所でゲラを出してもらってという流れではなくなる可能性がある。最初に、『辞書を作るための環境そのもの』を用意することが必要でした。そこで取り組むことになったのが、編集支援システムの構築です。例えば、ウェブ上のプラットフォームではタイトルや小見出しに指定すると、自動的に目次ができるものがありますよね。辞書ではもう少し複雑になりますが、簡単にいえば、そのようなウェブ上で完結するものを作ろうとしています」

 これまでの辞書編集は、あくまで紙を前提にした工程だった。見出し語、語義、用例、語誌、派生語、関連語——それぞれがゲラの上で管理され、最終段階まで磨き上げられていく。そこには、膨大な「手作業」が介在していた。

 対して、「第三版」ではその作業の全てをデジタル化し、「どの語に、どのような語義があり、どの用例が、どの時代のものなのか。それを一覧できるシステムを作る」ことになっている。

 この編集支援システム開発の中心を担うのが、前回に登場した坂倉さんである。大野さんは、「坂倉さんには編集支援システム、用例データベース、編集委員の先生と連携したNLP関係の仕組み——ほぼ全部を見てもらっています」と語る。

 次に編集作業におけるもう一つの柱が「用例データベース」の構築だ。

 「用例」とは何度も書いてきた通り、実際にこの世の中で使われた生身の文章である。誰かが書いた小説、日記、論文、新聞記事、古典の一節――。そこに現れた「実在の日本語」の痕跡を、そのまま引き写したものだ。

 あらためて用例主義がもたらす最大の価値を言えば、それは言葉を「時間の中」に戻すことにある。『日国』の用例は、最古のものでは『古事記』や『万葉集』にまでさかのぼり、そこから現代まで、資料が綿々と参照されていく。それはすなわち、「この言葉が、いつ生まれ、どう使われてきたか」を可視化する営みだ。

 その象徴的な例として、大野さんは「花」という言葉を挙げた。

「『日国』で“花”の項目を見ると、最初に出てくるのは百科事典的な意味の“花”です。でも、その次のブランチ(branch。一つの語の中で意味が枝分かれした意味の系統のこと)を見ると、“特に梅の花をいう”と書いてある」

 つまり、遣隋使や遣唐使の時代、中国文化の影響を強く受けていた日本では、「花」と言えば、まず「梅」だったことがそこでわかる。

「ところが、さらに次のブランチ、奈良時代から平安時代の後期になると、“花”は“桜”に変わるんです。嵯峨天皇の時代に桜が流行して、そこから“花=桜”という感覚が定着した、と言われています」

 いま、私たちが「花」と聞いて、多くの人が無意識のうちに思い浮かべる桜。その感覚が千年以上前の平安時代と、一本の線でつながっていることが『日国』の記述から読み取れるというわけだ。

「たった一つの“花”という言葉を引くだけで、日本人の美意識や、文化の方向転換までが見えてくる。これは、古い時代から用例がずらっと並んでいる『日国』だからこそ分かることなんですね」

 『日国』の価値そのものを支えるこの「用例」を、第三版では根本から整理し直すという。

「『日国』では一つの項目の中に意味のブランチが1、2、3、4と出てきて、それぞれにいちばん古い用例から新しい用例までが並んでいます。つまり、『この言葉が、いつ頃生まれて、どの時代の用例が確認できるか』が見えるようになっているわけです。初版では75万、二版では100万の用例が収録されていますが、今回どれくらい用例が集まるのか、作り方も変えていくため、大きく増えるのではないかと見ています」

 まさに『日国』の要となる要素だが、従来の辞書作りの過程ではある言葉について「江戸期の用例が薄い」と専門家が指摘しても、そこだけを効率よく補強するのは難しかった。紙のカードで「語」ごとに整理されている用例を、「時代」で横断的に検索する仕組みがなかったからだ。

「用例データベースにはさまざまな情報を付加してあるため、それができれば、時代や資料のジャンルなどで検索・確認することなども可能になり、意識して用例を採集するようなことも可能になります。これは、これまでの作りかたではできなかったことです」

 さらに第三版では、第二版のデータそのものの整理も避けて通れない作業だ。

 すでにデジタルデータ化されている第二版のデータの検証も必要だが、そもそも編集部の中にはカードのままの用例がいまも大量に眠っている。

「このカードはどこから来たものなのか、これは出典検討が済んでいるのか、これはまだなのか。そうした状態を用例ごとに全部確認しなければなりません」

第3回後編につづく)

ほかのコラムも見る