INTERNET Watch Title Click

【連載】

シアトル発インターネットビジネス最前線 第4回

データウェアハウス&データマイニングのASP:digiMine.com
─すべてのEビジネスにデータマイニングを提供─

http://www.digimine.com/

 米国では、“シリコンバレー”や“シリコンアレー”だけではなく、インターネット企業が集積したハイテク地区が次々と登場しています。IntelやFujitsuなどの工場があるオレゴン州北部のポートランド周辺と、MicrosoftやAmazon.comが本社を構えるワシントン州西部のシアトルやレドモンド周辺もまた、“シリコンフォレスト”と呼ばれ、インターネット企業の集積地になりつつあります。この連載では、シリコンフォレストから登場する注目の企業を紹介していきます。(本連載は隔週木曜日に掲載します。記事一覧はこちら


 ECサイトを含めたEビジネスの急成長にともない、サイト訪問者がどのページを訪れたか、どんな製品を購入したかといったデータが毎日大量に生み出されている。20カ月おきに世界中のデータ量が倍増していると言われるほど膨れ上がるデータは、現在のところどの企業でも持て余しているのが現状である。その中で、大量のデータを分析してある特定のパターンを認識することにより、顧客の嗜好性やユーザーの特徴を導き出し、それをマーケティングに活用する“データマイニング”に、企業からの注目が集まっている。調査会社のIDCとForrester Researchによると、データウェアハウスおよびデータマイニング市場は、2002年には500億~700億ドル規模の市場に伸びると予測されている。

 しかし、データウェアハウスの導入は技術的に複雑で数百万ドル規模のコストがかかる上、システム導入後もつきっきりで管理を行なうスタッフが必要になるため、データウェアハウスを実際に導入している企業は依然少ない。こうした状況を打開するため、ECサイトやEビジネス企業が特別なハードウェアやソフトウェアを購入することなしに、データマイニングを行なえるサービスを提供している企業が、digiMine.comである。

 今年3月に設立されたばかりの同社は、データウェアハウスとデータマイニングサービスをウェブベースで提供しているASP企業であり、現在、ベータ版のサービスを提供している。同社は、元Microsoftでデータマイニングの調査部門を設立したUsama Fayyad氏、MSNやアプリケーション部門でデータベースマーケティングを担当したNick Besbeas氏、Microsoft Commerce Server Productのデータマイニング分野の開発を担当したBassel Ojjeh氏の3人により設立され、業界有力者から500万ドルのシードマネーをすでに集めている。同社設立者の一人、Usama Fayyad社長兼CEOに、同社のビジネスモデルや今後の戦略を尋ねてみた。



●どの企業もデータマイニングに手付かず状態

Usama Fayyad
Usama Fayyad社長兼CEO
 digiMine.comのUsama Fayyad社長兼CEOは「現在ほとんどの企業がデータマイニングに失敗している。ECサイトは毎日膨大なデータを収集し、そのデータをいつかは役立てようと考えているが、どの企業も手付かずの状態だ」と語る。データマイニングとは、大量のデータの中から興味深いデータの構造を見つけて、グループセグメントなどの特定のパターンと統計的モデル、関係性を発見することである。

 データマイニングを行ないユーザーの傾向や嗜好性を把握するためには、まず、データ管理やキャプチャリング、データのクリーニングなどを行なう“データウェアハウス”を導入し、その後、データマイニングのアプリケーションを使ってデータ分析を進める必要がある。しかし、企業にとって、効果的なデータマイニングを行なうためにはいくつかのハードルを越えなければならない。まず、数百万ドルの費用を投じてデータウェアハウスを構築し、次に、その後のデータマイニングを含めたデータウェアハウスの運営管理を行なうことである。

 同氏は「データウェアハウスは、継続してデータを入力し続けなければ、すぐに役立たずの代物になってしまう」と語る。データウェアハウスを活用するためには、一定時間ごとに継続してデータを入力する必要があり、データのクリーンアップなど非常に手間のかかる仕事なので、その運営のためだけに数人のスタッフを雇う必要がある。しかし、大部分の企業はデータウェアハウス構築の予算は用意しているものの、運営のためのチームの予算は考えていないという。

 また、最新のウェブ技術を駆使している企業でも、自社のリソースをデータウェアハウスに費やすケースは少ない。たとえば、ECサイトのシステム管理者にとっては、ウェブサーバーを運営して最新の製品カタログやコンテンツをユーザーに提供することの方が優先順位だからだ。同氏は「多くの企業とデータマイニングに関する話し合いをして気づいた点は、優れたデータウェアハウスがあるにもかかわらず、それを最大限に活用している企業が皆無に等しいという点だ。CEOやCIOはデータマイニングを最大の優先事項としているが、これがシステム部門になると優先順位は6~7位ぐらいに落ちてしまう。私がMicrosoftのデータマイニング調査部門にいた時にも、状況は同じだった」と語る。digiMine.comでは、専門的な知識と膨大なリソースを費やすこの分野において、中小企業が採用できる方法は、唯一、ASPモデルしかないという。



●企業のウェブサーバーやDBからデータ抽出

Nick Besbeas
共同設立者の一人であるNick Besbeas
販売マーケティング幹部副社長(左)
 digiMine.comでは、同社のデータセンターに構築したデータウェアハウスに顧客企業のデータを転送することで、データマイニングサービスを提供している。具体的には、同社のサービスを利用したい企業と話し合い、その企業のサイトの目的や希望するデータ分析や報告機能を理解する。その後、企業のデータをキャプチャリングするためのソフトウェアコンポーネントを企業システムにインストールする。このソフトウェアは毎日もしくは数時間ごとに企業のウェブサーバーやデータベースからデータを抽出し、それを暗号化・圧縮してからdigiMine.comのデータセンターに転送する。

 digiMine.comのデータセンターには、バックエンドのデータウェアハウスであるSQLやOLAPのほか、Sequences、Classification、Clusteringをベースにしたデータマイニングアプリケーションが設置されている。顧客企業はIDとパスワードでdigiMine.comのサイトにアクセスしてレポートを閲覧する。顧客企業にとってみれば、自社のデータセンターが外部にあるような感覚で、マーケティング担当から企業幹部まで各自必要なデータを見ることができる。同社は顧客のデータ保護に関しては厳重な方針をとっており、顧客企業のデータを集計したり混合するようなことは一切行なわない。

 Fayyad氏は「Eビジネス企業は、サイト管理、ホスティング、サイト開発などの基本的なビジネスをベースに、コンテンツのパーソナリゼーション、クロス販売/アップ販売、キャンペーン管理などのマーケティングを行ないたいと思っている。データマイニングは、この双方を橋渡しする役割を演じている」と語る。たとえば、20%のユーザーがいつもゲームセクションに行くが、その他のページには行かないなどの結果がデータマイニングにより導き出されると、そのサイトはそれらのユーザーに対してゲーム製品の割引を提供するといったキャンペーンを行なうこともできる。

 また、digiMine.comは、数万種類の製品カタログに数百万人の顧客を抱えるECサイトに対して、予測モデルを作り、ある特定のパターンを見つけて、それをまとめることで何が起こっているかを示唆する。データマイニングの予測モデルのデザインは、企業が自社でデータマイニングに参入する際に最もよく失敗する部分でもある。予測モデルとは、たとえば、過去に特定のカテゴリーの中から5種類の製品を購入したことのある顧客は、同カテゴリー内のある製品も購入する可能性が高いといったもので、こうしたモデルを組み立てるには専門知識が必要になる。



●すべてのEビジネスにデータマイニングを

GameRoom
休憩室でゲームをするエンジ
ニアたち
 digiMine.comのデータマイニングサービスの最大の強みは、サービス料金の安さにある。まだベータ版ということもあり料金は公表されていないが、毎月のサービス料金はデータ量をベースに数千ドルから1万ドルであり、驚くほど安い。しかも、システム統合や設定にかかる料金も一切無料で、顧客が支払う料金は毎月のサービス料金のみである。こうした料金設定の理由として、Fayyad氏は「すべてのEビジネスは、データマイニングにより利益を受けるべきだからである」と主張する。

 同氏は「データマイニングインテグレーターは、その複雑さから数百万ドルの料金を請求しているが、その結果、巨額な予算が払える大手企業としかビジネスを行なわなくなっている。我々は、これに対して異議を唱えている。すべてのEビジネス企業がウェブサーバーを持っているように、どの企業でもデータウェアハウスとデータマイニングにアクセスできるようにしたいのだ。そのためには、データマイニングの専門家がバックエンドのサービスを全部担当するASPモデルが最適だ」と語る。

 同社は現在、ポータル、ECサイト、ASP、B2B、ストリーミングメディア企業、通信企業など15社のベータ顧客を抱えている。顧客企業名は9月に正式発表を行なうまで、公表できないとのこと。それぞれの企業にとりニーズが異なるように、多種多様な企業を集めているそうだ。同氏は「企業のニーズを聞くために、ウェブサイトを通して契約することはせず、直接会って話をすることにしている。また、サイト訪問者が百人未満の小規模なサイトにはデータマイニングを導入する必要はないので、中小規模のEビジネスや、コスト削減を図りたい大手ドットコム企業などがターゲットだ。話を聞いてからデータマイニング導入までは、数日間で実行できる」と語る。



●20億個の星に関するデータを分析

Entrance
digiMine.comのオフィスのある
カークランドのビル入り口
 Fayyad氏は、Microsoftの調査機関でデータマイニング部門を担当する以前、カリフォルニア州にあるNASAのJet Propulsion Laboratory(JPL)で1989年から1995年まで働いた経験を持っている。同氏はJPLで、科学的データの分析を行なうためにデータマイニング部門を開設し、20億個の星に関するデータ分析を行なった。同氏は「高感度カメラで夜空の写真を撮影し、そこに映された星や銀河をオブジェクト化してデータマイニングを行なった。それまでは、何千光年も離れた星や銀河の実態を調べることは至難の技であり、解決できない困難な問題の一つだった。多くの天文学者は統計をもとにマニュアルで調査を行ない、30年たっても調査は遅々として進まなかった。しかし、我々のデータマイニングアルゴリズムにより、94%のデータの正確度を達成した」と語る。それまでの科学者による調査では正確度は70%が限界だったため、同氏は世界中の注目を浴びるようになり、同機関からCaltech/JPL賞、NASAからはGovernment Medalを受賞した。

 同氏は次に、金星の地表を調査するプロジェクトに参加した。当時、金星については地球に構造が類似しているか否かで科学者間で大きな意見の食い違いがあり、これを解決するためには、写真データから数百万の火山の発達の仕方を検証する必要があったという。NASAは金星探査機「Magellan」を金星に送り、数年間にわたり地表のデータを収集し、地質学者らはそれらのデータをマニュアルで検証したが、数百万の火山の詳細に関して調べることは至難の技だった。そこで同氏は、火山のパターンを認識して分析するデータマイニングツールを開発したが、簡単なウェブのインターフェイスを持つこのツールは大成功を果たした。ちなみに、NASAに問い合わせると、3万枚の地表イメージが含まれた1,000ページにわたる文書を送ってくれるそうだ。

 同氏は、この2つのプロジェクトの成功をきっかけに、政府の医療機関や国防総省の情報分析などから頻繁にリクルートされるようになったという。そんなとき、Microsoftからもリクルートされたという。



●休暇旅行をきっかけに民間セクターで再出発

Street
digiMine.comの周辺の様子。
Microsoftからは車で5分
 Fayyad氏は1995年、Microsoftから「データマイニングシステムは、ビジネス分野で特に大きな価値があるので、ぜひ同社の調査部門で働いて欲しい」との打診を受けたという。同氏は「当時、Microsoftはそこまで大きな企業ではなかったし、調査部門には50~60人しかいなかったので、もちろん断った。その後、同社からシアトルへの休暇旅行をファーストクラスの航空券つきでプレセントされた。家族も含めた4日間のシアトル滞在で、1日だけMicrosoftを訪れてほしいと言われたので、最終日に同社を訪れてみた。そこで、調査部門の人々に会ったのだが、彼らの優秀さに感銘を受けた」と語る。

 同氏はその後、Microsoftに移籍、Microsoft Researchでデータマイニング技術を開発するData Mining & Exploration(DMX)部門を開設した。同氏によると、MicrosoftのSQL Server開発は1990年あたりに始まり、製品の発売までに10年近くも費やしているという。同氏は「Microsoftは、優れた技術を誰にでも安い値段で提供する。SQL Server 7.0はOracleの10分の1の値段だ」と語る。同氏は、同社在籍中、Microsoft Site ServerおよびCommerce Serverのデータマイニング機能、Microsoft SQL ServerおよびOLAP Services向けのデータマイニングツールなどを開発した。

 同氏は、MIT Press bookから1996年に出版された「Advances in Knowledge Discovery and Data Mining」という書籍の共同編集者であり、現在、コンピュータ関連の業界団体ACMのデータマイニング機関紙「Knowledge Discovery and DataMining」の編集長も務めている。



●2001年までに利益計上を狙う

 digiMine.comは、今年3月に企業を設立したばかりだが、社員数は現在60名を超え、急速に成長している。企業設立後すぐに、シアトル本社のデータマイニングコンサルティング企業、digiMineを買収して、データマイニングの専門家9人を雇い入れた。今年末には社員を120人にまで増やす予定だという。

 4月には、元Microsoft幹部で現在はシアトルの有力なベンチャーキャピタル投資会社であるSecond Avenue Partnersを率いるPete Higgins氏、Internet Capital GroupのSam Jadallah氏およびRobert Pollan氏、元Nextel Communications CEOのJamesVoelker氏、Silicon Valley Angelsなどから500万ドルの投資を受けている。同社の役員にはHiggins氏ほか、Avenue AおよびGear.comのNick Hanauer会長、元StarWaveCEOのMike Slade氏、Stanford大学教授のRajeev Motwani氏などが名を連ねている。

 今後は、IBMやOracle、Microsoftなどのデータベース企業が提供するASPサービスと競合する可能性があるが、同社は競合するよりも逆に補足的なサービスとして統合することができると考えている。同社は、今年中には5,000万ドルの投資を獲得し、2001年までには利益を計上する予定だと意気込みを見せる。

(2000/8/24)

[Reported by HIROKO NAGANO, Seattle]


INTERNET Watchホームページ

ウォッチ編集部INTERNET Watch担当internet-watch-info@impress.co.jp