Google、フォーム入力後のページを収集対象とする実験を開始

記事検索

最新ニュース

■

レゴ、小学生向けプログラミング教材「WeDo 2.0」発売

■

マクロウイルスを知らない世代の社員が狙われる？　「Office文書を開いて感染」攻撃が再び増加

■

新gTLD「.shop」、49億円でGMOが落札、AmazonやGoogleなどに競り勝つ

■

Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

■

インストール不要の非常駐型セキュリティソフト「Dr.Web CureIt!」、日本語版を無料で提供

■

筆まめ、中小事業者向け顧客管理ソフト「筆まめ顧客管理 Windows版」発売

■

大日本印刷が「サイバーナレッジアカデミー」設立、IAIの訓練システムでセキュリティ技術者を養成

■

「インターネット白書2016」発売、20周年記念の特別版

■

NEC、中小規模事業者向けセキュリティアプライアンス「Aterm SA3500G」を発売

■

Synology、2ベイNASのハイエンドモデル「DS216+」、暗号化データも上下100MB／秒以上で高速転送

■

公安9課が情報流出の危険性を解き明かす、「攻殻機動隊 S.A.C.」の描き下ろしPDFコミック「HUMAN-ERROR TRAPS」無償公開

■

Google Playに「マンガストア」オープン、ジャンプコミックスも配信開始

■

BIGLOBE、電力とインターネットのセットプラン、中部電力の首都圏エリア展開に合わせ

■

ウェブブラウザーのプライベートブラウジング機能、認知していた人は23.1％

■

LINE、違う電話番号のスマホから一方的にアカウント移管操作を行えないよう仕様変更

■

LINEのiPhone版アプリがiPadにも対応、「LINE for iPad」より多機能、大画面で音声・ビデオ通話が可能に

■

Microsoft、Officeと他社クラウドストレージとの連携を強化

■

Googleのディープラーニングシステムによって、人工知能が初めて囲碁のプロ棋士に勝利

■

ソラコム、IoTプラットフォーム「SORACOM」と既存システムを専用線でつなぐサービスや認証機能など提供開始

■

Google「Chrome 48」iOS版ではクラッシュ率70％低下、JavaScript実行速度も大幅改善

Google、フォーム入力後のページを収集対象とする実験を開始

　米Googleは11日、検索用のWebページを収集する手法として、Web中のフォームに適当な値を入力し、表示されるページを収集対象とする実験を一部のサイトに対して行なっていることを公表した。

　Googleの公式ブログに投稿された記事によれば、この実験は通常のクローリングでは収集できない「ディープWeb」などと呼ばれるページを検索対象とするための取り組みとして実施しており、実験は既に数カ月前から行なっているという。Googleでは、これまでもページ中のJavaScriptやFlashをスキャンすることで新たなページを見つける手法などを用いてきたが、さらにフォームの入力後に表示されるWebページについても収集対象とするための実験を開始したとしている。

　収集方法としては、HTML中にFORMタグを発見した場合に、テキストボックスにそのサイトで使われている適当な単語を入力し、セレクトメニューやチェックボックス、ラジオボタンなども適当な値を選択してフォームを送信。結果として得られたページの内容によっては、Googleのインデックスに含めることがあるという。

　Googleでは、この実験は特定の少数のサイトのみを対象として実施しており、収集用のエージェントはrobots.txtやnofollow、noindexなどの指示に従っていると説明。対象とするのはGETメソッドによるフォームのみで、パスワードやユーザーIDなどの入力フォームに対してはこの実験は行なわず、取得結果はGoogleのPageRankには影響を及ぼさないとしている。

関連情報

■URL
　 Google公式ブログの該当記事（英文）
　 http://googlewebmastercentral.blogspot.com/2008/04/crawling-through-html-forms.html

（三柳英樹）
2008/04/14 16:13

- ページの先頭へ-

INTERNET Watch ホームページ

Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved.