やじうまWatch

5年経つとページの6割が消滅……各府省サイトのコンテンツの「残存率」が明らかに

 インターネット資料収集保存事業を行っている国立国会図書館が公開した調査データが興味深いと話題になっている。これは各府省のサイトにおいて、時間の経過とともにどれだけのコンテンツが消滅しているか、その「残存率」を示したデータ。これによると、2010年に存在していたコンテンツのうち、5年後に当たる現在は6割ものデータがなくなっているのだとか。調査データでは各府省ごとの残存率のほかディレクトリごとのなくなりやすさ、ファイル分布といった傾向も調査しており、これらの結果をもって「ウェブアーカイブの重要性を再認識させる結果」であると総括している。古いページを消すことで利用者の誤解を防ぐ効果はあるだろうし、単純にメンテしきれないといった運用上の問題、またこうしたアーカイブシステムが稼働していることを前提に古いページを抹消しているのではといった指摘もあり、運営する側も言い分はありそうだが、ともあれ「残存率」が数値として出てきたのは興味深い。この機会に国立国会図書館のインターネット資料収集保存事業のあらましをチェックしてみてはいかがだろう。

◇国の機関サイトの残存率(国立国会図書館インターネット資料収集保存事業)
http://warp.da.ndl.go.jp/contents/reccommend/collection/linkrot.html
◇1. ウェブアーカイブとは(国立国会図書館インターネット資料収集保存事業)
http://warp.da.ndl.go.jp/contents/reccommend/mechanism/mechanism01.html

(tks24)