国立情報学研究所、約1900万冊の書誌情報検索サービス「Webcat Plus」


NIIの図書情報サービス「Webcat Plus」

 国立情報学研究所(NII)は21日、図書情報サービス「Webcat Plus」を全面リニューアルし、公開した。

 「Webcat Plus」はこれまで、全国の大学図書館1000館に所蔵されている書籍を中心に、書籍情報の検索サービスを提供してきたが、今回、国会図書館の所蔵目録などを新たに検索対象として追加。サイトのユーザーインターフェイスも全面リニューアルし、約1900万冊の書籍情報を検索できるサービスとして提供する。

 追加されたデータは、国会図書館の「日本全国書誌JAPAN/MARC」(図書書誌約450万件、雑誌書誌約14万件)や、全国古書籍商業協同組合提供の「日本の古本屋」データベース(古書在庫目録約540万件)など。さらに、新刊和書の書影(約45万件)や、青空文庫の書誌(約3000件)、ウィキペディア日本語版の人物情報(約15万件)などもデータとして追加。これらのデータを統合し、約1900万冊の書籍に関するデータのほか、本に掲載された「作品」単位での情報や、本の著作者など「人物」に関する情報もデータベースとして整理した。

 リニューアルしたWebcat Plusのサイトでは、自然文から連想される書籍を検索できる「連想検索」と、キーワードによる「一致検索」のサービスを提供する。検索した書籍情報は「書棚」に保存でき、さらに書棚に保存してある書籍から連想される書籍が検索できるサービスも提供する。

自然文からの検索が可能検索結果ページ
検索した書籍情報は「書棚」に保存できる「書棚」からさらに連想される書籍が検索できる
NII連想情報学研究開発センター長の高野明彦氏

 NII連想情報学研究開発センター長の高野明彦氏は、「Webcat Plusはこれまでも専門家には使われていたが、普通の方に使っていただけるサービスを目指してリニューアルした」と説明。自然文や選択した複数の書籍から連想される書籍が検索できるなど、Webcat Plusは通常のキーワード検索だけでない「知の集積を自由に探索できる思索空間の実現を目指している」とした。

 また、今後の電子書籍時代を考えた場合には、「本というパッケージ単位での情報から、作品単位での情報の重要性が増すと考えられる」ことから、短編集やアンソロジーなどに含まれる個々の作品についてのデータを整理することに挑戦したと説明。現在のデータベースには書誌情報などから抽出した「作品」約150万件、「人物」約600万件のデータがあり、現時点ではまだ精度が不十分だが、さらに本の中にある情報を引き出していきたいとした。

 現時点では、検索結果に含まれる国会図書館や古書店などへのリンクが、それぞれの検索トップページへのリンクとなっているが、今後は該当書籍情報に直接リンクにする形にしていくと説明。また、現在の検索対象は書名や著者名などの書誌データや目次情報となっているが、システムとしては書籍全文からの検索にも対応できるものとなっており、提供を受けた電子書籍データや、青空文庫のような著作権保護期間の過ぎた作品などからの全文検索についても対応を検討していきたいとした。


関連情報

(三柳 英樹)

2010/6/21 18:46