iNTERNET magazine Reboot

時間軸で情報を眺める検索エンジン、「TIMEMAP」で変わる情報検索の意味

 2017年秋、一般社団法人タイムマップは年表型のユーザーインターフェイスで検索結果を表示する検索エンジンTIMEMAPをリリースし、年末には日本電子出版協会(JEPA)主催の2017年電子出版アワード「デジタル・インフラ賞」を受賞した。

 いうまでもなく、これまでのウェブ検索といえば、グーグルがその代名詞になっているが、検索結果は検索エンジン独自の重みづけによる順序で、入力したキーワードが含まれるページの一覧を表示するものだ。しかし、この方法だけでは、特定の情報には効率的にたどりつけても、関連する情報の全体像は見えてこない。一方、TIMEMAPは、検索結果を情報が発生した日付の順に年表形式で表示することを特徴としている。さらに、年表は自然な対話操作で時間的な粒度を自在に拡大したり、縮小したりできる。サービス開始時点では、インプレス社のIT分野のニュースメディアであるWatchシリーズ、ニュースリリースのアーカイブサイトであるレッドクルーズ社のJPubbに収録されているコンテンツ、新書の情報を集めたウェブサービスである新書マップを検索できるようになっている。今後はこれに他のジャンルのニュース記事、過去の製品カタログ、企業社史、歴史的資料などの情報源を追加して、幅広い分野の情報を時系列にして比較閲覧でき、世の中の事象の変化や推移から新たな発見を支援するサービスを目指している。

 ここではTIMEMAPのコンセプトを考案した一般社団法人タイムマップの代表理事で、国立情報学研究所教授の高野明彦氏にお話を伺った。

――TIMEMAPを着想した背景について教えてください。

一般社団法人タイムマップ代表理事の高野明彦氏

 2005年頃、グーグルマップが発表されたとき、大変な衝撃を受けました。なぜなら、私たちのデジタル地図に対する見方がまったく変わったからです。それまでのデジタル地図といえば、紙の地図と同様に特定の縮尺の地図を表示するものでした。仮に、自分の関心のある建物や店を探そうとしても、それが表示している縮尺の地図には載っていないということがよくありました。しかし、グーグルマップでは自然な対話操作で縮尺を自在に変更でき、しかも、任意の場所をズームインしていくと、地理情報と結びついた詳細な情報が浮き出してくるのです。

 これと同様のことが文書系の情報検索にも適用できないかと考えたのがTIMEMAPです。地理的空間に情報が関連付けられたのと同じく、時間軸に情報を関連付けられないかということです。すでに膨大な情報がウェブには存在していますから、そもそもキーワード検索だけで求めている情報を一覧にすることは困難です。どのような粒度で検索結果を閲覧すると、利用者の関心のある情報が見やすいかも様々です。地図の縮尺をズームイン・ズームアウト、ピンチイン・ピンチアウトの操作で変えられるように、時間軸の分解能を自然な対話操作で変えることができれば、情報の見え方も変わり、読み取れる情報も変わってくるだろうと考えました。

 実は、このアイデアは「NHK放送文化アーカイブ」の年表検索を実装するときにチャレンジしていました。しかし、このサイトはNHK内限定のサービスで、一般には公開されませんでした。今回、ユーザビリティを改良したシステムを広く一般に公開し、なるべく多くの方に使っていただくため、20年にわたり日々IT分野のできごとを記録してきたメディアであるインプレス社のWatchの協力を得て、IT業界のニュース検索というサービスに適用したのです。

図1:ウェブブラウザーの名称を検索し、その出現回数などから、開発競争、シェア争いの動向を大局的に把握することができる

――TIMEMAPは時系列で表示するという斬新なアイデアにとどまらず、関連する情報を検索するためのエンジンにも特徴がありますね。

 ニュースの見出しを時系列で表示するだけでなく、検索された見出しをクリックすると、記事の本文が閲覧でき、さらにはそれと関連する情報、例えば、月刊で発行されていた「インターネットマガジン」という雑誌の解説記事、年刊で発行されていた「インターネット白書」に記載された分析記事という異なる視点で編集された出版物の記事へもリンクするようになっています。このように関連情報を検索するためには「汎用連想計算エンジン GETA」を利用しています。GETAは文書情報の類似性を高速に計算するソフトウェアで、国立情報学研究所の研究チームが開発し、オープンソースで配布しています。

 世の中の情報検索はグーグルのようなキーワード検索が一般的になっています。しかし、キーワード検索は、対象となる情報にそのキーワードが内包されているかどうかよって決まってしまいます。言葉による表現はもっと幅広いものですから、同じ意味を持っていても、言い方が違ったり、単語が違ったりすれば検索結果には反映されません。そこで、そのものズバリの単語と一致するかどうかで探すのではなく、その語と一緒によく使われる別の単語を利用して「連想」することで、意外な情報が探せたりするのではないか、つまり探している人の意図を単語だけではなく、例示した文章として探すなら、キーワード検索の弱点を補えるのではないかという発想で開発しました。

 1日単位で発生するニュース、1か月単位で解説された雑誌、1年単位で総括された白書という、編集意図や時間分解能の異なる情報は、単純なキーワードだけで適切に関連付けることは困難ですが、「連想」という技術によって、有機的に結びつけることに成功していると考えています。

図2:TIMEMAPで検索したニュースの見出しから、関連する月刊誌「インターネットマガジン」の記事、年刊書籍「インターネット白書」も閲覧して理解を深めることができる

――TIMEMAPの今後の発展についてはどのようにお考えですか?

 現在はまだIT関連の情報を扱っているだけですが、それ以外の分野での利用も十分に可能だと思います。たとえば文化財をキーにして、関連する情報、縁のある観光地についての情報をつないでいくサービスも実現できそうです。例えば、利休の茶碗を検索すると、茶道の歴史、その茶碗を収蔵している美術館の情報、周辺地域の観光情報などへと拡大していくことです。さらに、大企業の社史などは、企業グループの歩みのみならず、産業そのものや技術革新の足跡を表していると考えられます。時系列に沿っている情報群、つまり日付が特定されている資料で、ある程度均質な密度で蓄積されている情報があれば適用可能です。

 幸い、日本電子出版協会で紹介する機会をいただいたり、今回の電子出版アワード受賞したりしたことをきっかけとして、すでにいくつかの組織や企業からもご相談をいただいています。TIMEMAPは今の形が完成形ではなく、これからも多様な情報を付加することで、すでに各所で蓄積されてきた情報をさまざまな軸で閲覧するプラットフォームとして育てていきたいと思っています。関心のある方は、ぜひお問い合わせください。

図3:ニュースリリースから「人工知能」「IoT」「仮想通貨」を検索すると、どの企業がいつごろからこうした技術を採用した製品を発表しているかがわかる