Internet Watch logo
記事検索
最新ニュース

米Google、著作権切れの書籍を発見するための基礎データを公開


 米Googleは23日、著作権の保護期間が切れてパブリックドメインとなった書籍を正確に発見するための基礎となるデータを公開した。

 パブリックドメインとなって自由に利用できる書籍を探すのは、それほど簡単なことではない。著作権が切れる年は発行年を見ればわかるように思えるが、米国の著作権法は複雑だ。1923年から1963年の間に出版された米国の書籍に関しては、出版から28年が経過した段階で申請を行なえば、著作権を延長することができた。しかしほとんどの場合、延長はされなかったと考えられている。そのため、おおざっぱに言えば、1923年から1963年の期間の書籍は、自由に利用できるはずだ。

 しかし、法的に問題なく書籍を利用するためには、どの書籍の著作権が延長されたかどうかを確実に知る必要がある。米国著作権庁の記録は、1978年以降の分がインターネットで公開されているが、丸ごとダウンロードすることはできない。また、古い記録に関してはデジタル化されていないという問題もある。

 そのためカーネギーメロン大学のUniversal Library Project、パブリックドメイン書籍を集めて公開しているProject GutenbergとDistributed Proofreadersの3者が、人海戦術でコンピュータに入力する作業を行なっていた。

 GoogleのエンジニアであるJarkko Hietaniemi氏は、これら両方のデータを組み合わせて1つのXMLファイルにまとめ、今回、公開することになったと説明。これらの記録には間違いが含まれている可能性もあるが、現時点で入手できる記録の中では最良のまとまったものではないかと考えられるとしている。

 このデータを検索することによって、自分が関心を持つ書籍の全文が利用可能かどうかを確認することができるようになった。パブリックドメイン書籍の公開という目標に向けて、大きな一歩を踏み出したと言えるだろう。


関連情報

URL
  Google Book Search公式ブログの該当記事(英文)
  http://booksearch.blogspot.com/2008/06/us-copyright-renewal-records-available.html
  編纂された著作権更新記録のXMLファイル(ZIP)
  http://dl.google.com/rights/books/renewals/google-renewals-20080516.zip

関連記事
「Google Book Search」に新機能、書籍の内容をプレーンテキストで表示(2007/07/04)


( 青木大我 taiga@scientist.com )
2008/06/24 12:11

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved.