INTERNET Watch Title

Click


ちょっと知りたいページの裏側

第1回:検索デスク

■URL
http://www.bekkoame.or.jp/~asaisan/

 今回からお送りする新連載「ちょっと知りたいページの裏側」は、皆さんがご存知のさまざまなサービスやコンテンツが、どうやって作られているのかといった、なかなか知る機会がないところをインタビューしようというものです。

 さて第1回目は、「検索エンジンの検索力」レビューなど、ほかに類を見ないほど検索に関する情報が充実している「検索デスク」。このサービスは、なんと浅井勇夫氏が一人で作成しているとのこと。さっそくお話をうかがうことにしました。

●本職は文献検索の研究

IW編:まずは、「検索デスク」を始めたきっかけを教えて下さい。

浅井:'96年の年賀状に「ホームページを作りました」と案内を入れていたので、それまでに間に合わせたかったのですが、できなくて(笑)。お正月に慌ててつくりました。構想は、クリスマスぐらいからあったのですが、サービス開始は、'96年1月18日からです。

IW編:検索エンジンをテーマにした理由は?

浅井:本職で文献検索の研究をしている関係で、以前から使っていたし、興味もありました。'95年10月にサーチエンジンについての論文も発表しました。

IW編:アクセス数は?

浅井:現在、トップページのアクセスは、週平均1万4千件。絶えずコンスタントに増えている状態です。

IW編:ご自身のインターネット歴は?

浅井:インターネットを始めたのは'95年3月からなんです。ROMばかりでしたが、もともとパソコン通信は以前からやっていました。インターネットを始めた当初は、ほとんど英語のサイトが主流だったので、英語のサーチエンジンは結構勉強しました。'95年8月ぐらいから日本のサーチエンジンが出始めてきたと思います。最初は何もわからなかったから整理して、自分流に解説を付けてホームページに出していました。

IW編:それで、海外の検索エンジンなどについてもかなり詳しいのですね。

浅井:アメリカは日本より2年ぐらい先にやっているから、情報量も多いし、サーチエンジンもすごいわけですね。逆に言うと、日本がアメリカの水準にいくには、あと1年半ぐらいだと思うんです。今はアメリカの例を見たらどうなっているかというと、検索だけじゃなくて、総合情報というのかな、ニュースとか、株価とか。Yahoo!などがそうですが、あれがひとつのパターンだと思うんです。

●調査はシステマチック

IW編:新しい検索エンジンなどの、ネタの探し方はどうしていますか?

浅井:登録系の新着情報や、新聞などを見て情報を得ています。

IW編:作業の時間はどのくらいかけているんですか?

浅井:インターネットはそりゃもう、毎日ですよ。前は朝5時頃に起きてやったり、夜中に目が覚めたら無理してもやっていました。インターネットの世界はスピードが速いわけだから、追っかけたりしてたら、それはひっくりかえる(笑)。そこらへん、今は気楽にね。

IW編:作業のしかたについて、教えていただけますか?

浅井:毎週日曜日の朝作業しています。どんな工程かは、これからお見せします。いつも断わってるんですが(笑)

--特別に目の前で実演してくれた内容をまとめると、以下のとおり。

  1. 調査用のHTMLをローカルに置いておき、1項目をワンクリックで調査。これを一通り回って調査する。
  2. 調査用のHTMLは、「Altavistaで『JavaScript』を検索」といった検索内容がそれぞれURLになっている。HTML自身もawkなどを使って自動生成したもの。
  3. こうして件数などを調べ、EXCELに入力していく。調査結果はawkを使って集計したり、EXCELでグラフを作ったりといったことを定型で処理する。

IW編:なるほど、よくできたシステムですね。

浅井:最初はこういうシステムをつくっていなかったので、すべて手作業で大変でした。アクセスは日曜の朝なので、それほど(ネットワークは)遅くないです。日本の場合は、ロボット系(gooなど)と登録系(Yahoo!など)と2種類ありますが、登録系はそれほど変化がなく、検索力は2倍3倍には違わないため、2~3週間に1回の調査です。ロボット系は、やはり違うので毎週出します。でも、更新されていないものも多数あるんですよ。

IW編:更新されてないサイトはどのくらいあるんですか?

浅井:だいたい、10あるうちの4つぐらいしか更新されていないんです。最初の3語で更新されていないなら、そのサイトのその週の調査は打ち切ります。だいたいどのサイトがどのタイミングで更新するかは、わかっているんですけどね。最近の傾向としては、ボランティアでやっているところがだんだん不利になってきているんですよ。特に大学関係。大学生がやっているわけですから、卒業する人もいるでしょう。そうしたら誰があとを継ぐかなどの問題がある。先生が引き継いでいるところもありますね。

IW編:少し前、Altavistaがシステム入れ替えたことを、正式発表される前からレポートしていたことがありましたね。それはどうしてわかったのですか?

浅井:毎週定期的にデータをとっているので、一つ前に調査したデータと、今回と一週間でどのくらい違っているかをチェックしているんです。すると、この間(Altavista)の時のように、全部が大きく変わったな、ということがあるんですよ。そのときは、これはおかしいなということで、ちょっと待って、もう一回検索項目を半分に減らしてやってみるんです。でも、同じ結果だったので納得して掲載しました。そんなことがあって、2~3日したら正式な発表があったと…。

●網羅性は「goo」、分類なら「Yahoo!JAPAN」

IW編:浅井さん自身が一番すごいと思う検索サイト、またはお気に入りのところがあれば教えて下さい。

浅井:現段階では、ありません。ただ、検索サイトに必要なのは、やはり網羅性、絞り込み、ランキング(一致しているパーセンテージなどの順位付け)、コメントです。でも、コメントはベースがよくない場合もありますから、しかたない部分もある(笑)。Web検索は従来の、データベース検索技術の後を追っている部分があると思うし、これからそうした技術もWeb検索に流れてくるのではないかと思っている。今は急成長の時期で、安定しているわけじゃないから、これからですね。

IW編:現状であげるとすると、どこでしょうか?

浅井:(考え込んだ末)強いて言えば、網羅性という意味ではやはりgooが一番ですね。Yahooと比べると、1対10ぐらい情報量がある。でも、やはり情報をどういうふうに捉えるかですから。例えば、「検索デスク」は約230ページあるんですが、登録系の場合、230ページをまとめたひとつの紹介しか出てこない。逆にロボット系は、内容としては10行か20行ぐらいしかない情報が少ないものでも、持ってくる。

IW編:でも、同じサイトのページがたくさん出すぎても、探しにくい気がします。確かに情報は細かく出てきますが…。

浅井:登録型としては、Yahoo!JapanとNTTディレクトリーでしょうか。国内の分類型では、ダントツにYahoo!JAPANがいいです。一つの分類で1,000項目とか出てきてしまうようでは意味がない。(ロボット型に戻ると)Infoseekは、紹介文のところがgooよりいいでしょう。でも、検索に関してはgooのほうがいいんじゃないかな。個人的には、自然言語形式などの検索より、条件式を自分で書くほうが好きです。ただし、書式がサイトごとにばらばらなのは面倒なので、「検索デスク」では「空白で区切ったらAND」というふうに直して検索するようになっています。

●これからはWeb以外の検索も

IW編:最後に、これからどんなことをやりたいと考えていますか?

浅井:今は検索の方をやりたくてしかたがない(笑)。何をしたらいいかは分かってるんですけど、もう時間がなくて。もっと時間があればカテゴリも増やしたい。今やっているWeb検索だけじゃなくて、音楽とか、CDとか、あぁいう専門的な検索ですね。
 CDならCD、本なら本で、そのサイトに行けばほとんど網羅している、というサイトがあれば、そこで検索すればいいわけですから。


IW編:これからも、体に気を付けてがんばってください。ありがとうございました。  

                          ('97年11月インタビュー)


■浅井氏Profile■

某大学経営工学科の研究者。パソコンは'81年頃から始める。趣味はなく、今は検索デスクだけ、と言い切るところに、意気込みがうかがえる。

利用環境は、Pentium133のショップブランドのパソコン。OSはWindows 95。アクセスはINS64。ブラウザーはNetscape Communicatorを利用。HTMLは秀丸エディタで手書きだ。
作業はダイニング兼書斎でする。「寂しがりやだから、一人で書斎にこもってやっているのはいや」という浅井氏だが、「夕御飯食べながらやっていて、朝もずっと。だからここ(ダイニング)にいるんですよ(笑)」とは、奥様の弁。

('98/2/2)

[Reported by junko@impress.co.jp]


INTERNET Watchホームページ


ウォッチ編集部INTERNET Watch担当 internet-watch-info@impress.co.jp