ニュース

ISBNコードの重複、書誌割れ……クラウドソーシングで同定して横断検索システムを改善、京都府立図書館やカーリルらが連携プロジェクト

 京都府立図書館は11月30日、府内の図書館・読書施設の蔵書を一括検索できる「京都府図書館総合目録ネットワークシステム」の充実を図るための産官学連携プロジェクトを発表した。書籍データをクリーニングし、検索精度の向上や情報の拡充を目指すもの。国立国会図書館、同志社大学、筑波大学、千葉大学、株式会社カーリルと連携して実施する。

 京都府立図書館によると、現状の総合目録ネットワークシステムでは、同一の書籍について複数のデータで表示される、シリーズものが連続して表示されていない――といった課題があるという。プロジェクトでは、同システムのデータを国会図書館のデータと突合し、同一の書籍を同定。機械的に同定できないデータについては、全国の公立図書館で初の試みとだいうクラウドソーシングによって、システムや図書館に関心のある人に参加してもらい、1つ1つ判定する仕組みを導入する。

 これにより、検索結果において同一書籍は1つのデータで表示されるとともに、シリーズものの書籍は並んで表示されるようになり、使いやすくなるという。また、書籍に関する資料データの項目も、現在の8項目(書名、署名の読み、巻次、著者名、著者名の読み、出版社、出版年、ISBN)から約30項目へと拡充。価格、「○○叢書」などのシリーズ名、著者名標目(著者情報の補足)、翻訳の場合は原タイトル、付録情報、電子資料アクセス情報などが追加されるとしている。

連携プロジェクトの仕組み(京都府立図書館のプレスリリースより)

 カーリルでは、ISBNによる高速な書誌同定が可能な業務用高速横断検索API「Unitrad API」を提供しているが、同社によれば「ISBNの運用は出版者に任されているため、しばしば誤ったバーコードが印刷されてしまったり、重複してコードを利用している例がある。また、ISBNのない本については、同一かどうかの判定が機械的にできないため、バラバラに表示される」。図書館用語で“書誌割れ”と呼ばれるこのような問題により、検索キーワードによっては書誌割れが多くなり、十分な精度の検索結果が提供できない場合があったという。

 プロジェクトでは、図書館ボランティアのクラウドソーシング「L-Crowd」で書誌同定のヒント情報を収集。「それらのヒント情報により書誌割れを抑制し、検索精度を大幅に向上することを目指す」としている。