電子書籍の(なかなか)明けない夜明け

第4回 番外編:「電子書籍交換フォーマット」の正体を総務省に聞く


「電子書籍交換フォーマット標準化プロジェクト」の真意とは?

 現在の電子書籍をめぐる情勢は激動をきわめている。様々な人が電子書籍について発言する一方、どれを信じてよいか簡単に判断がつかない。こうした状況では、なるべく中心にいるキーマンの発言に注視する必要がある。

 2010年10月27日、総務省は『平成22年度「新ICT利活用サービス創出支援事業」(電子出版の環境整備)に係る委託先候補の決定』を発表した[*1]。これは「デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会」(以下、3省懇談会)による報告書[*2]に基づいて公募された、電子書籍に関わる基盤整備事業の委託先を公表したもの。そのうちの1つが、第3回で取り上げた中間(交換)フォーマットを具体化する「電子書籍交換フォーマット標準化プロジェクト」だ。これについては、前回の「付記」で簡単に触れた[*3]

 では、このプロジェクトにはどのような真意が込められているのか。誰のために、どんな意図で考えられた計画か、総務省で電子書籍を所管する松田昇剛統括補佐(情報流通行政局情報流通振興課)に、直接話を聞く機会を得ることができた。これはその記録である。

 取材は前記発表の翌28日朝、電話で行われた。読みやすさのために文言に多少の手を加え、専門用語を注で説明するようにした。

「電子出版日本語フォーマット統一規格会議(仮称)」との関係について

――先に発表された「電子書籍交換フォーマット標準化プロジェクト」ですが、3省懇談会の報告書では、「電子出版日本語フォーマット統一規格会議(仮称)」(以下、統一規格会議)が中間(交換)フォーマットを審議することになっていたと思います。これとの関係はどうなっているのでしょうか。

松田:今回の公募にあたって、こちらから出した「課題」では、〈国内ファイルフォーマット(中間(交換)フォーマット)の共通化に向けた環境整備(報告書で掲げられた「電子出版日本語フォーマット統一規格会議(仮称)」の設置・運営を含む。)〉としています。つまり委託は統一規格会議の「運営を含む」のです。

――なるほど。

松田:今回は日本電子書籍出版社協会(以下、電書協)が受託しましたから、電書協が適切なメンバーを集めて、統一規格会議を開催することになります。我々総務省、文科省、経産省も、オブザーバーという形で参加し、メンバーについても相談いただく形になるでしょう。

――ぼくはてっきり官庁が所管する審議会の形でやるのだと思っていました。だから動きがないことを不思議に思っていたのですが、既に会議の運営を含めて公募していたんですね。

松田:ええ、例えば3省懇談会の報告書では権利処理の集中化の問題ですとか、出版社に何らかの権利を付与するかどうかの問題とか、あるいは電子書籍と図書館の位置付けをどう考えるのかとかいった問題も盛り込まれています。これらは文部科学省の役割となっていますが、やはりこういったテーマでは、行政が主催をしなければならないものだと思うんです。しかしフォーマットの話は基本的に技術の問題ですから、まずは民間の中で標準を決めていただき、我々はその後押しをするのが筋だと思います。

統一規格会議で取り上げられるテーマについて

――分かりました。統一規格会議の関連で少し質問します。報告書の中では、統一規格会議の仕事として中間(交換)フォーマットの検討以外に2つ挙げられていたと思います。1つはいわゆる外字問題[*4]。もう1つは全文テキスト検索の問題です[*5]。統一規格会議では、この2つも含めて審議されるのでしょうか。

松田:報告書で扱われている分野はかなり広いので、3省の間で役割分担を決めております[*6]。外字の関係については「外字・異体字が容易に利用できる環境の整備」ということで、経済産業省の方で実施いただくということになっています。これまでも経産省は、Unicodeの関係も含めコンピューターが利用するフォントをどうするかということに取り組んできました。この10月26日に補正予算案が閣議決定されまして、経産省が外字・異体字の利用環境整備に係る実証実験も含めて2億円の予算要求を行っていたと思います[*7]。補正予算案が国会で了承されれば、今年度内に執行されることになるのではないでしょうか。

――ということは、外字・異体字の関係は統一規格会議と切り離して考えるべきなのでしょうか。

松田:いえ、予算的には切り離すんですが、報告書では当然連携しろというふうになっておりますので、統一規格会議では外字関係のアウトプットも含めて反映していただくことになると思います。

――はい、分かりました。

松田:それから、全文テキスト検索の問題ですが、統一規格会議で審議される中間(交換)フォーマットを、全文テキスト検索を実現するサービスの過程で活用することも考えられます。一方で国立国会図書館において、39の出版社、印刷会社等と共同して、10月から実証実験が始められています。今年度内に、検証用のプロトタイプシステムを構築し、版下データ、電子書籍データ等を基にした全文テキスト検索に関する技術的課題の検証をあわせて行って、過去から現在までの資料の統合的な全文テキストデータ検索の実証実験が行われる予定です。総務省の取り組みと大きく関係するため、密接に連携を行うことにしています。

オープンでフリーな中間(交換)フォーマット変換ツールを開発

松田:いずれにせよ、まずはこの中間(交換)フォーマットを決めてからだと思っています。既存の紙だとか、既存の電子書籍だとか、出版社の保有している様々なコンテンツがありますので、それを電子書籍の形に転換する道を開くのが最優先課題でしょう。

――なるほど。

松田:それを実現するために、既成の紙や電子書籍のデータから中間(交換)フォーマットに変換するツールの開発を行います。それだけではなくて、さらにXMDFやドットブック、あるいはEPUBといった、様々なフォーマットに変換するツールも必要です。さらにそれらの検証を行います。

――ずいぶん大がかりな話なのですね。

松田:中間(交換)フォーマットの目的というのは、要は出版社が電子書籍のフォーマットをこの形式で保管していれば、資産として今後も活用できる、そういうものを作ろうというものなんです。資産として意味がある形にするためには、中間(交換)フォーマットが様々な端末、プラットフォームで利用される閲覧フォーマットに容易に変換可能であることが重要です。

――分かりました。ツールについて一点お聞きしたいのですが、それはオープン、フリーで公開されるのですか?

松田:ええ、ホームページにもあると思いますが、電書協もオープンかつフリーだということを強調されておりますので、その辺は我々の方でも後押ししていきたいと思います。

誰のための中間(交換)フォーマットなのか?

――よく中間(交換)フォーマットのことを、閲覧フォーマットと誤解する人が多かったのは確かで、今回公開された資料(図1)によって、ずいぶんそれが解消されるように思います。
松田:それはありますね。

図1 電書協による「電子書籍交換フォーマット標準化プロジェクト」の説明

――それで、この資料で驚いたのは、入力の側(左側)に「既存電子書籍」があるのは当然として、「新規作成」「紙書籍」「印刷データ」まで含んでいることでした。

松田:今、印刷用のデータというのは、印刷会社などに保有されていることが多いわけですが、けっこう様々な形で保存されております。やはり印刷用のデータは基本的には電子書籍として販売することを前提としていないものですから、そういう意味ではデータをInDesignで作っていても、バージョンが違っていたりとか、構造化がなされていない、あるいはそもそもデジタルでは保存されていない、つまり紙のものも多いということで。そういうものも簡単に電子書籍として流通できるようになれば、中小の印刷会社、出版社にとってもコンテンツを提供しやすくなるのではないでしょうか。

――なるほど。

松田:さらに言うと、実現にあたっては中小の印刷会社・出版社さんの負担も考えるべきです。その中の1つの要素として、中間(交換)フォーマットが様々な種類のものを変換できて、かつオープン、フリー、さらに印刷会社も含め普及を図る、そういうことであれば、電子書籍ビジネスは中小印刷会社・出版社にとっても1つの選択肢となり得るでしょう。電子出版市場に多様なコンテンツが提供され、ユーザーが多様なコンテンツから端末の種類を問わずに、求める電子書籍を利用できるようにすることが重要です。

――そうですね。

個別の予算額について

――少し話は飛びますが、予算についてお聞きします。個別の額が公表されていないのですが、例えば今お答えいただいていた電子書籍交換フォーマット標準プロジェクト、これはおいくらでしょうか?

松田:契約額については、各社に対して示した契約上限額をもとに、これから詰めていきますので、必ずしもこの額になるということではないので、その旨はご了解いただきたいのですが、「電子書籍交換フォーマット標準化プロジェクト」の契約上限額は約1億5000万円です。

――それから、イーストさんに決まったEPUB日本語対応のプロジェクトは?

松田:「EPUB日本語拡張仕様策定」の契約上限額は約9000万円です。

――分かりました。

中間(交換)フォーマットはEPUBにも対応

――最後の質問です。たぶん世の中で一番懸念されていることは「ガラパゴス化」、つまり国際標準の大きな流れ、特にウェブ標準の流れと違う規格を作ってしまうことへの懸念だと思います。そういう意味から中間(交換)フォーマットのことを考えますと、ドットブックやXMDFは約10年前の規格です。例えば文字コードひとつとってもシフトJISを前提に考えられています。あるいはXMDFの規格書をみますと、H1タグ、ヘッドラインの親子関係を記述するタグが存在しなかったりします[*8]。これでは通常の意味での文書の構造化ができません。

松田:なるほど。

――ただしぼくはこれが悪いとは思いません。XMDFは少ないCPUのリソースを文書の構造化より画面効果に振り分けた、割り切った仕様だと思います。そしてそれは携帯電話が普及した日本では、非常に功を奏した。ただし他方で、先ほど言いました世界のウェブ標準の流れを考えると、やはり昔の規格であることのデメリットは否めない。例えば中間フォーマットという技術を考えると、その機能の上限は取り扱うフォーマットに制約されます。

松田:そうですね。

――つまり、もしもドットブックとXMDFしか扱えない中間フォーマットを作った場合、その機能はきわめて限定的なものになってしまい、さきほどの「ガラパゴス化」の懸念が的中してしまうことになります。ただし、現代のウェブ標準に基づくEPUBも扱えるなら懸念はなくなります。つまり中間フォーマットでは対象にするフォーマット次第で、能力がかなり左右される訳です。

松田:そこはホームページで出している絵にもあるかと思いますけども、出力側はEPUBも当然あります。

――そうなんですか。見落としていました。

松田:ただEPUBからの入力は、ちょっと分からないですね。EPUBの日本語文献というのは、なかなかないものですから。しかし少なくとも出力側にはあるというふうに聞いております。

EPUBよりドットブックとXMDFを重視する理由

松田:日本の出版社が使うという意味では、現状のEPUBはまだまだと言わざるを得ないんですね。今回のイースト、JEPA(日本電子出版協会)のEPUBの縦組み対応プロジェクトを採択したのも、まさにそのためです。世界的に見ればEPUBリーダーはたぶん普及すると思いますので、縦組みで日本の出版が世界に発信されるということは、とても重要だと思います。

――はい。

松田:電子書籍とウェブの融合を考えると、当然EPUBだけじゃなく、本当はHTML5とCSS3も念頭においてやらないといけない。これについても「次世代ブラウザの縦書きレイアウトの規格化」を目指して取り組みを進めていこうとしております[*9]

――そうだったんですか。

松田:話を戻しまして、おっしゃるとおりXMDFやドットブックは10年前のものかもしれません。しかし現実的な問題として、やはり出版社側の理解を得ないと、なかなか電子書籍にするコンテンツが出てこないということがあります。そういう意味では、これまで実績のあるドットブックだとかXMDFというものは、出版社側の理解を得やすい。

――それは大事ですね。

松田:現実にコンテンツを拡大させないと、電子書籍元年だとか言われても、なかなか現状は打破されないと思います。ですから、まずは出していただくのが重要だと思いますし、そのために出版社が何を望んでいるのかをお聞きしながら、行政として環境整備を進めていきたいと思っています。電子書籍の中間(交換)フォーマットの標準化は、3省懇談会を通じて出版社が強く支持したものです。ドットブックとXMDFを統合・発展する形でまとめておけば、そこからEPUBも含めて様々なフォーマットへの変換も可能になります。こうして出版社側が提供する統一中間フォーマットによって制作環境を整え、一方で、配信プラットフォームやメーカーには多様な閲覧フォーマットで自由に競争していただくと、そういうふうに考えております。

――本日はお忙しい中、どうもありがとうございました。

注釈

[*1]……『平成22年度「新ICT利活用サービス創出支援事業」(電子出版の環境整備)に係る委託先候補の決定』2010年10月27日(http://www.soumu.go.jp/menu_news/s-news/01ryutsu02_01000005.html

[*2]……『デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会報告書』2010年6月28日(http://www.soumu.go.jp/main_content/000075191.pdf

[*3]……「電子書籍の(なかなか)明けない夜明け」第3回、2010年10月29日(http://internet.watch.impress.co.jp/docs/column/yoake/20101029_403226.html

[*4]……報告書では〈出版物のつくり手の意図を正確に表現できるようにする〉ことを目標とし、そのためのアクションプランとして〈今後、外字の収集方法、整理方法、文字図形共有基盤の運営方法、利用端末での外字の実装方法などについて、[略]「電子出版日本語フォーマット統一規格会議(仮称)」を活用しつつ、関係者における議論等を積み重ね、必要に応じて国として必要な支援の在り方について、検討することが望ましい。〉(P.48)と提言している。

[*5]……全文検索とは〈文書や出版物等の全てのテキストデータ(本文、タイトル、目次、作者名など)を対象に任意のキーワードで検索すること〉(P.35、脚注28)である。具体的にはGoogleブックサーチのような検索サービスを想定し、これらと連携をとるため、電子書籍については直接データを検索業者に渡すこととし、その際の受け渡し用データフォーマットとして〈(中間(交換)フォーマットの利用等)の検討も必要である。〉(P.36)とされている。この問題については、以下のブログエントリーも参照。『日本語の本の全文検索→一部表示サーバーをインターネット上につくる(仮称=ジャパニーズ・ブックダム)』2010年2月22日、沢辺均(http://www.pot.co.jp/diary/20100222_222832493916834.html)、「沢辺さん、国立国会図書館全文テキスト化実証実験定例会で怒る」2010年10月29日(http://togetter.com/li/63874

[*6]……3省の役割分担については、「総務省政務三役会議資料」2010年7月28日(http://www.soumu.go.jp/main_content/000075996.pdf)のうち、「「デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会」の報告に係る具体的施策の各省分担について」(P.2~P.3)を参照。

[*7]……『「円高・デフレ対応のための緊急総合経済対策」経済産業省関連施策・補正予算の概要(資料集)』P.10(http://www.meti.go.jp/topic/downloadfiles/101008strategy04_1027.pdf

[*8]……“IEC 62448 Ed. 2.0, Multimedia systems and equipment - Multimedia E-publishing and E-books - Generic format for E-publishing” (International Electrotechnical Commission, Geneva: 2009.)

[*9]……詳細は「【資料1】国際標準化戦略に関する検討チーム取りまとめ(案)」(http://www.soumu.go.jp/main_content/000083988.pdf)P.4~P.5を参照。従来の日本の標準化政策は、ISO、IEC、ITU等の伝統的な政府系国際標準化機関が制定する公的標準(デジュール標準)を重視するあまり、W3CやIETFなど、非政府系標準化機関の標準(フォーラム標準)を軽視する傾向があった。HTML5やCSS3はいずれもW3Cが管轄するフォーラム標準であり、従来の政策を見直さないとこれらへの対応を誤ってしまう可能性が指摘されていた。こうした背景の元「グローバル時代におけるICT政策に関するタスクフォース/国際競争力強化検討部会」が、2010年10月5日に開かれた第5回会合で打ち出したのが、この「取りまとめ(案)」だ。


2010/11/4 06:00


小形 克宏
文字とコンピューターのフリーライター。2001年に本誌連載「文字の海、ビットの舟」で文字の世界に漕ぎ出してから早くも10年が過ぎようとしています。知るほどに「海」の広さ深さに打ちのめされる毎日です。Twitterアカウント:@ogwata