プレスリリース
「プレスリリース」コーナーでは、企業や団体などのプレスリリース(報道用発表資料)をそのまま掲載しています。株式会社Impress Watchは、プレスリリース記載の内容を保証するものではありません。また、プレスリリース記載の情報は発表日現在の情報です。閲覧いただく時点では変更されている可能性がありますのでご注意ください
IIJ-II、ビッグデータ処理技術を応用したWikipedia人気記事ランキングシステムを公開
(2013/6/13 06:00)
株式会社インターネットイニシアティブ(IIJ、本社:東京都千代田区、代表取締役社長:鈴木 幸一、コード番号:3774 東証第一部)は、100%子会社でIIJグループのR&Dセンターである株式会社IIJイノベーションインスティテュート(IIJ-II、本社:東京都千代田区、代表取締役社長:浅羽 登志也)が開発したクラウド技術「Project Gryfon(プロジェクト・グリフォン)blank」の応用事例としてWikipediaの人気記事ランキングシステムを構築し、本日、一般に公開したことをお知らせいたします。
■Wikipedia人気記事ランキングシステム
http://www.gryfon.iij-ii.co.jp/ranking/
オンライン百科事典として有名なWikipediaは、記事の自由な複製・改変を認められていることから、その辞書データが、自然言語処理やテキストマイニングといった研究分野で広く活用されています。
この度IIJ-IIでは、この辞書データをテキストマイニング系ビッグデータ解析における基礎データとして活用し、クラウドアプリケーション向けプラットフォームとして現在開発を進めている「Project Gryfon」の技術を応用した事例として、Wikipedia人気ページを収集、集計するランキングシステムを構築しました。
本システムでは、日本語版Wikipediaのデータ(2013年5月末時点で約171万ページ)について、1時間毎の各ページビュー情報を取得し、アクセス数が多いページを順に表示しています。また、前日のデータ集計をもとにしたカテゴリ毎のランキングを、「急上昇TOP 10」、「アクセス数TOP 10」、「平均アクセス数TOP 10」などの分類で見たり、トラフィックの推移をグラフで見ることができます。
IIJ-IIでは、本システムでの成果を踏まえ、より効率的にビッグデータを解析するためのプラットフォームの開発を進めるとともに、今後はその応用範囲を拡大してまいります。
■IIJ-IIについて
株式会社インターネットイニシアティブ(IIJ)のグループ子会社として、2008年6月に設立されました。次世代インターネットの基盤技術と新しい事業モデルを日本から創出することを目的に、新技術の開発および事業育成のためのインキュベーション事業を行っています。IIJがこれまで培ってきたインターネット関連技術とビジネス運営の経験をもとに、インターネットのさらなる発展のための研究開発、および事業化支援の活動を推進していきます。詳細については、http://www.iij-ii.co.jp/blankをご覧ください。