[木曜コラム] ---------------------------------------------------------------------------- 検索サービスのいろいろ ---------------------------------------------------------------------------- インターネット上の情報が増えることは喜ばしいが、大量の情報の中から目的のペ ージを見つけるのに骨が折れるのは困ったものだ。そこで頼りになるのがYahooに代 表される検索サービスだが、米国ではそれに続けとばかりにInfoseek、Lycos、 Exciteなど同様のサービスがどんどん登場し、またそれぞれが進化している。私が名 前を知っているだけでも10サイト以上はある。日本でも、6月11日付けの本紙で報じ たように「WebdeW」というサービスがリクルートから登場するなど、サービス向上が 期待できる。 検索サービスには、大きくカテゴリー分類型とキーワード検索型がある。しかし、 どんなにしっかり運営されているサービスサイトでも、欲しい情報がなかなか見つか らなかったという経験をした読者は少なくないだろう。この原因は、カテゴリー分類 型では、分類した人と検索する人が別人であり、文化も価値観も違うことから来ると 思われる。たとえば、「車のエンジン」について調べようとした場合、それは「スポ ーツ」という項目に分類されているのか「エンターテイメント」なのか、それとも「 サイエンス」なのか分からない。 この場合は、「エンジン」というキーワードで検索する方が圧倒的に早く探せそう である。では、キーワード検索が万能かというとそうでもない。たとえば、「山」に ついて検索しようものなら「山田」さんや「山本」さんのホームページを一緒に見る ことになってしまう。また、はっきり特定できるキーワードだからといっても、 「FAX」のページを見つけようとする場合は「ファックス」、「ファクシミリ」も含 めてOR検索をしなければ全部の情報を見たことにならないだろう。 つまり、誰もが納得できる完璧な検索方法はまだ見つかっていないということだ。 しかしそれでも、なるべくヒット率を高めようとして様々なアプローチが行われてい る。前出のWebdeW( http://webdew.rnet.or.jp/ )は、その改善策として言語工学 研究所が提供する同義語辞書を使っている点が新しい。たとえば、「映画」について キーワード検索した場合は「シネマ」、「ムービー」、「銀幕」なども一緒に検索対 象にしてくれる。十分試したわけではないので確証はないが、先のFAXのような場合 には有効だと思われる。 また、別のアプローチとしては、キーワードの出現回数を数えることで頻度表を作 り、より頻度の高いものを優先するサービスもある。米国のExciteはその方法を利用 していると聞いている。さらに、文章の構文を解析してもっと的確な検索サービスを 提供しようというオムロンアルファテックのようなアプローチも発表されている(本 紙6/11号)。ただ言えることは、どの方法をとったとしても、人間が内容を見て探す のに匹敵するサービスを提供することは、完璧な翻訳ソフトを作るのと同様に永遠の テーマだと言うことだ。 検索サービスではないが、上記したようなソフトウェア工学的なアプローチではな く、人間が1つひとつ評価し、その評価が高かったものだけをお勧め情報として提供 するサービスもある。たとえば、"TOP5%"のキャッチフレーズで有名なPoint ( http://www.pointcom.com/ )のようなサービスだ。Pointの翻訳サイトを運営す るザクソン社( http://www.xaxon-net.or.jp/ )の弁では、これはWebミシュランだ とのことだ。もちろん、この場合は全部の情報から探したことにはならないが、無駄 な情報が最初から検出されないという利点がある。逆に難点は、評価者の価値観が大 きく介在してしまうことだろう。 読者は、いつもどのサービスを利用されていることだろうか。 (編集長 井芹:watch-info@impress.co.jp) (96年6月13日)