電子書籍の(なかなか)明けない夜明け

第3回 ナゾの「中間(交換)フォーマット」


3つの省庁が連携して電子書籍をめぐる課題を解決

 2010年3月10日、総務省と文部科学省、経済産業省が電子出版をめぐる多くの課題を検討するために、ある懇談会を発足させた。その長い名を「デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会」という[*1](以下、3省懇談会)。

 この懇談会が3カ月の審議を経てまとめた『デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会報告』[*2](以下、報告書)は、著作権の集中管理や出版社への著作隣接権の付与、図書館への電子書籍の納本、あるいは日本の出版物をどうやって海外に発信するのかといった幅広い検討を行っている。

 中でも特に注目を集めたのが、前回の終わりに少し触れた「中間(交換)フォーマット」の統一規格化だった。これが何をするものか、なぜ必要なのか、報告書は以下のように説明している。

(1)多様なファイルフォーマットの存在と電子出版のワークフロー
[略]我が国において、電子出版を様々なプラットフォームや様々な端末に向けて提供することに必ずしも成功してこなかった一つの要因として、多様なファイル形式(ファイルフォーマット)に対応することによる電子出版制作の非効率性[略]が指摘されている。
 この結果、出版物のつくり手は、新しい端末や新しいプラットフォームが登場するたびにそれぞれに最適化した電子出版に作り直す必要があり、一つの作品に対していくつものファイルを作らなくてはならない状況[略]にある。
 出版物のつくり手からは[略]様々なプラットフォーム、端末が採用する多様な閲覧ファイルフォーマットに変換対応が容易に可能となる、中間(交換)フォーマットの確立が求められている[略]。
 日本語表記に係る中間(交換)フォーマットの標準が確立できるのであれば、出版物のつくり手にとってコストの削減や、電子出版をリリースするまでの期間の短縮、様々な電子出版端末・プラットフォームでの提供・利用等、大きな効果が期待できる。

(2) 国内ファイルフォーマット(中間(交換)フォーマット)の共通化
[略]この点、本懇談会において、日本語表現に実績のあるファイルフォーマットである「XMDF」(シャープ)と「ドットブック」(ボイジャー)との協調により、出版物のつくり手からの要望にも対応するべく、我が国における中間(交換)フォーマットの統一規格策定に向けた大きな一歩が踏み出された。これについて、出版社や印刷会社から賛同・支援する趣旨の意見が表明されている。(報告書、P.27~P.28)

XMLと中間フォーマットの関係

 この報告書の記述そのものは現実的で、おおむね納得のできる内容だ。補足すれば、「中間フォーマット」とはXML(eXtensible Markup Language)などでよく使われる技術用語。XMLが登場する以前、文書を別のフォーマットに変換しようとする際は、いちいち専用のソフトウェア(コンバーター)を開発しなければならなかった。しかしゼロからプログラムを書かなければならないし、少し複雑な変換をしようとすると工数がかかってしまい効率が悪い。XMLの普及はこれを簡単にした。

 XMLは文書を構造化するための言語だ。文書の中に「タグ」と呼ばれる印を付けることで、その文書を構成する要素が一目で分かるようになる。同時にタグは要素間の親子関係も記述できるので、その文書全体の構造(成り立ち)も明確化される。こうした文書の構造化がもたらすメリットは数多くあるが、フォーマットの変換が簡単にできるようになることもその1つだ。

 例えばデータベース管理ソフト(DBMS)は操作が覚えにくく万人向けとは言いづらい。そこでデータフォーマットをXMLにすれば、同じXMLの仲間であるXHTML(HTML)へ容易に変換できる。これによりDBMSに収納したデータはそのままで、ユーザーが閲覧や入出力を行う際には慣れ親しんだウェブブラウザーを使うことができるようになる。

 しかしXMLによるフォーマット変換が本当に力量を発揮するのは、この例のような一対一よりも、むしろ一対多の変換だろう。中間フォーマットはそこでのキーワードとなるものだ。例えば携帯サイトのコンテンツを作る場合を考えよう。

 よく知られているように、NTTドコモ、au、ソフトバンクの3キャリアの携帯サイトはタグやその機能、あるいはCSSの構文が微妙に異なっている。また、同じキャリアの中でも端末の世代ごとに仕様が少しずつ変わっている。だからといってキャリアごと、世代ごとに別々のデータを作るとなると、経済的にも時間的にもコストが合わなくなってしまう。何よりそんな作業は不毛だ。そこで3キャリア共通のタグや構文はそのままに、違うものについて新たに中間的な表現を定義することにする。その結果できるものが中間フォーマットだ。

 この中間フォーマットでデータを作成すれば、1つのデータから3キャリアのいずれにも書き出せるようになる。つまり一対多の変換だ(図1)。各種のウェブサイトを制作するコンテンツ管理システム(CMS)でも、XMLの機能を前面に押し出しているものは、この中間フォーマットを使ったソリューションと考えられる。

図1 XMLによる中間フォーマットを使うと、携帯キャリアの微妙な違いを抽象化できる

 このように中間フォーマットとは、何も電子書籍にだけ使われるものではない。ここで報告書に戻ると、ここで示された〈様々なプラットフォーム、端末が採用する多様な閲覧ファイルフォーマットに変換対応が容易に可能となる、中間(交換)フォーマットの確立〉という解決法は、前述した携帯コンテンツ業者の悩みやその解決法と構図が共通していることに気付くだろう。

なぜか閲覧フォーマットと誤解する人が続出

 このように「中間(交換)フォーマット」の統一規格化は、一見すると良いことずくめのように見える。だから発表されると絶賛者が続出……とはいかなかった。むしろ報告書が出た当時、多くの人はこれを否定的に捉えたように思う。じつのところ、そのほとんどはこれを閲覧フォーマットと混同した誤解だった。しかしそのような誤解が生じたのにはそれなりの理由があり、それこそが報告書の大きな問題点であるように思える。

 おそらく最も早い誤解の例は、朝日新聞の「日本語の電子書籍 規格統一出版促す」と題する6月9日朝刊にある記事ではないか。その最後の段落に、以下のような記述があった。

 電子書籍が読める端末は米アップルの「iPad(アイパッド)」など、米国発の端末が先行している。
 ただ、米国の規格では日本語特有の振り仮名や縦書きが出来ない問題があった。新設の会議は、マンガを始めとする国内コンテンツの海外展開を図るため、日本語の電子書籍に最適な閲覧フォーマットの国際標準化も目指す[*3]

 これによると日本政府として国際標準化を目指す電子書籍のフォーマットは、閲覧フォーマットということになっている。しかし後で引用するように報告書にはそのような記述はない。つまり事実と違う。もう少し詳しい記事の例として朝日新聞と同じ日に公開された、以下のブログのエントリーを見てみよう。

・「「日の丸電書フォーマット」とEPUB」2010年6月9日、EBook2.0 Forum、鎌田博樹(http://www.ebook2forum.com/2010/06/j-format-vs-epub/

 この記事が強く非難するのは、「日の丸電書フォーマット」(=中間(交換)フォーマット)がEPUBに背を向けている点だ。EPUBとはアメリカに本拠を置く電子書籍の標準化団体、IDPF(International Digital Publishing Forum)[*4]が制定する電子書籍の規格のこと。中間(交換)フォーマットが基づくというドットブックと違い、内容が完全に公開されている。この規格の性格を大きく際立てているのは、ウェブ標準であるXHTML/CSSに基づいていることだ。つまり、これらとの親和性がきめわて強い。こうした点を踏まえて鎌田氏は以下のように書く。

EPUBと争うことは有害無益だ。それは進化を続けるWeb(XHTML+CSS)に背を向けることであり、日本語E-Bookの開発と運用に無用のコスト負担を生じさせる。日本の消費者は負担したくないだろうし、海外企業も同様だ。様々な欠点を持ちながらも、EPUBの巨大な利点は、Web技術との共有性であり、それが出版社の自立性を高め、様々なサービスとの自由な連携を可能にする。

 引用からも分かるように、この記事の特徴は国際的な規格、とくにウェブ標準との関係の中で中間(交換)フォーマットを見ようとしているところにある。この記事が出たのは報告書が発表される数週間も前のことであり、こうした早いタイミングから広い視野に立った分析ができるところに筆者の力量を見ることができる。

 ただし、前述したような中間フォーマットの目的と機能からすれば、「EPUBと争う」ことなど本来あるはずがない。すでに上で引用したように、報告書ではこれが何を意図したものなのか、読み間違いようがないほど明確に説明してある。つまり、鎌田氏の批判には根本的な矛盾があるように思える。

 XMLでの変換技術など先刻承知と思われる人が、これを説明した報告書の記述などまるで存在しないかのように誤解し、批判した。彼だけではない。同じような誤解をした人はまだたくさんいる[*5]。興味深いことに、そうした人達にはある共通点があった。彼等は鎌田氏と同様、EPUBがウェブ標準と強い親和性があることを根拠に、日本の電子書籍業界がEPUBと食い違った方向に進むことを心配しているのである。いわば「EPUB派」、というより「ウェブ派」といえるのだが、報告書にはそうした立場の人を強く反応させる何かがあったことになる。では、それはどんな記述か?

国際規格にするのは、閲覧フォーマットでも中間(交換)フォーマットでもなく?

 おそらくそうしたウェブ派が反応したのは、報告書にある「(3)ファイルフォーマットの国際標準化」という見出しをもつ本文のうち、赤字で示した部分であるはずだ。

(3)ファイルフォーマットの国際標準化
 電子出版は工業製品であり、世界への展開・普及のためには、国際標準化が求められる。
 WTOのTBT協定(Agreement on Technical Barriers to Trade)が1995年に発効して以来、各国は国内強制規格等を作成する際、ISO、IEC等の国際規格(公的標準)が存在する場合には、原則として当該国際規格(公的標準)を基礎とすることが義務づけられている。
 また、WTOのGP協定(Government Procurement)により、政府調達品の技術仕様は、国際規格(公的標準)が存在するときは、当該国際規格(公的標準)によることが義務づけられている。
 このため、中国を始めとする各国の電子出版に係る大規模な政府調達に対応した輸出、他国による日本の電子出版規格の排除の防止、今後の我が国の政府調達協定対象機関による電子出版の公共調達を念頭に、我が国の電子出版規格に即した日本語表現が可能なファイルフォーマットを国際規格(公的標準)としていくことが必要である
 こうした観点から、我が国の関係者が強く働きかけを行い、電子出版の国際標準組織であるIEC(International Electrotechnical Commission; 国際電気標準会議)Technical Committee 100 Technical Area 10(Multimedia e-publishing and e-book)において、我が国のXMDF等をベースとした中間記述フォーマットIEC62448 の国際標準化を実現したところである。
 今後、2. 1 (2)の日本語基本表現の中間(交換)フォーマットの統一規格の反映や、上述のEPUB等海外のデファクト標準であるファイルフォーマットとの変換に係る技術要件も検討の上、国際規格IEC62448の改定に向けた取組が重要であり、上述の「電子出版日本語フォーマット統一規格会議(仮称)」を活用しつつ、国際標準化活動を進め、こうした民間の取組について国が側面支援を行うことが適当である。(報告書、P.30~P.31)

 この部分は次回も取り上げるので、ひとまず前後は読み飛ばし赤字部分だけ読んでもけっこうだ。ウェブ派の人々の懸念は、おそらく以下のようなものではないか。

 もしもこの報告書どおりに、国の支援を受けた独自の電子書籍フォーマットが国際規格になれば、日本は世界のウェブ標準の流れから取り残されてしまう。これでは、またガラパゴスだ!

 彼等がこうした連想をしたことは、ウェブ派が書いた原稿の多くに「ガラパゴス」の語が登場することでも分かる。ここで言うガラパゴスとは、この数年日本のIT業界で「反面教師」の意味で(うんざりするほど)広く流通している言葉だ。大変な努力の末に開発した日本の高度技術が、結果として国際標準から懸け離れ、まるで進化の袋小路に陥ったように進退きわまることを指す。ただし、じつのところ制作途中で使われるに過ぎない中間フォーマットがEPUBと競合し得ないことは、ここまで書いてきたとおり。

植村資料に見る中間(交換)フォーマットの実像

 もっとも、報告書の側にも誤解されても仕方ない点があった。もう一度、報告書の赤字引用部分をよく読み直してほしいのだが、この部分では国際標準にするのが閲覧フォーマットとは書いてないのは当然として、あれほど熱心に推進していたはずの中間(交換)フォーマットとも書いていない。国際規格にする主体は、あくまで〈我が国の電子出版規格に即した日本語表現が可能なファイルフォーマット〉であり、それ以上でもそれ以下でもない。逆に言えば閲覧でも中間でも、極端な話EPUBでさえも〈我が国の電子出版規格に即した日本語表現が可能〉であれば何でもOKという論理になる。まさに玉虫色の官僚文学であり、これでは読む人が誤解しても仕方はない。

 では、実際のところ国際規格に提案されるのは閲覧フォーマットなのか、それとも中間(交換)フォーマットなのか。これについては「電子書籍中間(交換)フォーマット統一案とIEC62448改訂」という公開資料を見ると一目瞭然だ(図2)。これは3省懇談会において、フォーマットをはじめ技術的な分野の審議を行った下部組織、「技術に関するワーキングチーム」の第6回で配布された資料。作成者は植村八潮構成員(日本書籍協会)。

図2 中間(交換)フォーマット統一規格に対する提案(技術に関するワーキングチーム資料6-1、植村八潮、P.5)[*6]

 植村資料を見ると中間(交換)フォーマットの位置付けが非常にクリアになる。これによれば、その目的は〈配信フォーマットではなく、コンテンツを交換する為のフォーマット〉だ。これを〈中間(交換)フォーマット統一規格〉として国際規格化するというのが植村構成員の提案した概要である。

 具体的な内容としては、構造とスタイルの記述は分離し、そのうち構造記述部分を〈日本語ミニマムセット〉とそれ以外の〈拡張セット〉の2つに分けるという点が目を引く(以上、植村資料p.5より)。さらに別のページには、もっと踏み込んだ計画が語られている(図3)。

図3 中間(交換)フォーマット統一規格のスコープ(技術に関するワーキングチーム資料6-1、植村八潮、P.6)

 スコープとは規格の適用範囲のことだが、これによると、統一規格は多様なジャンルの出版物の「日本語の基本表現部分」、つまり最大公約数を規定するものだという(図3中央の赤線で囲まれた円内)。これによって構成の単純な小説等はカバーできるだろうが、複雑な雑誌や芸術書等については新たにジャンルごとの拡張中間フォーマットを作ることを想定する(図3で赤丸の外周部分を指す)。さらには独自のハウスルールに基づく各社版拡張中間フォーマットを規定することも可能という(図3で最外縁部の花びら状部分)。このように3段構えのなかなか気宇壮大な計画なのだ。そして最後のページには日程が示されている。

図4 スケジュール案(技術に関するワーキングチーム資料6-1、植村八潮、P.8)

 これによると、IEC(International Electrotechnical Commission:国際電気標準会議)に対する国際提案と、JIS(Japanese Industrial Standard:日本工業規格)に対する国内提案の二本立てで考えられている。前者は既成の電子書籍の規格、IEC 62448の改訂案として中間(交換)フォーマットを今年12月に委員会提出、来年第4四半期に最終投票案提出、そして再来年2012年の第3四半期に制定されることを目指すという。なお、このIEC 62448は現行版で中間(交換)フォーマットの核の1つとなるシャープのXMDFを附属書Bとして収録している。ただし、改訂とは附属書Bの改訂なのか、それとも新たに附属書Cを追加しようというものなのか、今のところまだ分からない。

 JISの方は、まず現行のIEC 62448を来年2011年第1四半期にJIS化完了、国際の方でIEC 62448の改訂作業が終了するのを待って、そのJIS化に着手するのだという。この計画通りに進むならば、かなり早く標準化が終了できる印象だ。

 技術に関するワーキングチームは全部で7回開催されたが、その最終回の議事要旨だけが公開されていない[*7]。したがって現在のところワーキングチームとして植村資料にどういう結論を下したのかは不明とするしかない。しかし、報告書の内容が植村資料に即した内容であることから、植村氏の提案がほぼそのまま了承されたものと考えられる。もっとも、報告書が設立を表明した「電子出版日本語フォーマット統一規格会議(仮称)」は、10月下旬現在開催されていない。何か不測の事態が生じたのだろうか(この部分、付記参照)。

新たに浮かび上がる、2つの疑問

 さて、このようにして中間(交換)フォーマットに対する実像はかなり明確になった。するとより新しい本質的な疑問が湧いてくる。それは以下のようなものだ。

  • 日本語のローカルなフォーマットを変換するための規格が、果たして国際規格として適格と言えるのか?
  • 果たしてドットブックとXMDFを基礎にして、〈日本語をめぐる基本的なフォーマットの根幹〉(報告書、P.28)になり得るのか?

 これについては、次回考察を進めることにしよう。

付記

 以上の原稿は2010年10月25日に脱稿し編集部に送られた。ところがその2日後、10月27日になって事態が大きく動いた。総務省が発表した「平成22年度「新ICT利活用サービス創出支援事業」(電子出版の環境整備)に係る委託先候補の決定」[*8]である。

 かねて同省は、報告書が示していた課題を解決するプロジェクトの提案を公募していた。これは応募されたものに対して外部有識者による評価を実施、その結果を参考に委託先候補として決定したもの。お恥ずかしい話だがこの動きはノーマークであり、迂闊と言わねばならない。

 「別添1 平成22年度「新ICT利活用サービス創出支援事業」に係る委託先候補」[*9]という文書を見ると、7つの課題に対して10のプロジェクトが決定されている。その筆頭に〈国内ファイルフォーマット(中間(交換)フォーマット)の共通化に向けた環境整備(報告書で掲げられた「電子出版日本語フォーマット統一規格会議(仮称)」の設置・運営を含む。)〉という課題が示されており、その解決法として「電子書籍交換フォーマット標準化プロジェクト」が提案されている。提案者の代表は日本電子書籍出版社協会(電書協)であり、共同提案者として東京電機大学、大日本印刷、凸版印刷、慶昌堂印刷、豊国印刷、ボイジャー、シャープ、シャープビジネスコンピュータソフトウェアが名を連ねている。まさに今回の原稿で扱った中間(交換)フォーマットを決めようというプロジェクトだということが分かる。

 さらに「別添2 平成22年度 新ICT利活用サービス創出支援事業 採択案件(10件)概要一覧」[*10]を見ると、提案者が提出した解説の図がまとめられている(図5)。

図5 提案者による「電子書籍交換フォーマット標準化プロジェクト」の説明

 これを見ると、今回の原稿で取り上げた「中間(交換)フォーマット」が「電子書籍交換フォーマット」という名前で登場している。おそらく以降はこの名前が流通するのだろう。これが変換を目的とする中間フォーマットであることは当然として、この図によると、入力側は「新規作成、紙書籍、印刷データ、既存電子書籍」となっている。個人的にはこれは意外だった。というのは、中間(交換)フォーマットについて、それまで既存の電子書籍データを変換・統一する目的としか考えていなかったからだ。しかし、この図によれば新規作成はもちろん、印刷データ、たとえばInDesignのデータさえも変換することを目的としている。さらに出力側にドットブック、XMDFがあるのは当然として、EPUBも明記されていることは注意すべきだろう。

 このプロジェクトについて、総務省でこの案件を管轄する情報流通行政局・情報流通振興課の松田昇剛統括補佐に話を聞くことができた。ごく短い電話取材に過ぎないが、総務省が中間(交換)フォーマットにかける意気込みを聞くことができたように思う。これを番外編としてまとめ、遅くとも11月5日までに公開する予定で作業中だ。どうかご期待いただきたい。

注釈

[*1]……設置のプレスリリースは『デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会」の開催』総務省/文化庁/経済産業省、2010年3月10日(http://www.soumu.go.jp/menu_news/s-news/02ryutsu02_000026.html)、議事録・配布資料は『デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会』総務省(http://www.soumu.go.jp/main_sosiki/kenkyu/shuppan/index.html)を参照。
[*2]……「デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会」報告の公表』総務省/文化庁/経済産業省、2010年6月28日(http://www.soumu.go.jp/menu_news/s-news/02ryutsu02_02000034.html
[*3]……「日本語の電子書籍 規格統一出版促す」朝日新聞、2010年6月9日、朝刊、東京本社第13版、13面。これに先行して、ほぼ同様の記事が前夜から同社「asahi.com」(http://www.asahi.com/business/update/0608/TKY201006080359.html)にて公開されている。
[*4]……International Digital Publishing Forum(http://www.idpf.org/
[*5]……他に中間(交換)フォーマットを閲覧フォーマットと誤解した例として、以下の2つの記事を挙げておこう。「電子書籍の政府での議論が心配だ」2010年6月29日、Publickey、新野淳一(http://www.publickey1.jp/blog/10/post_112.html)、「日本の電子書籍は、ガラケーと同じ道をたどるのか?」NETMarketing Online、中村祐介(http://business.nikkeibp.co.jp/article/nmg/20100810/215764/)。両者とも本文で引用した鎌田氏とよく似た立場をとっていることが分かる。なお、前者の記事では「XMDF+ドットブックは中間交換形式として用いるとのことだったので、この部分は的外れでした」として、閲覧フォーマットとして扱った部分を削除している。もう1つ、似た立場のものを紹介しておこう。「電子書籍でも失敗を繰り返すメディア業界の「ガラパゴス病」」2010年8月4日、ASCII.jp、池田信夫(http://ascii.jp/elem/000/000/544/544407/)。この記事は先に紹介したものと違って事実誤認がきわめて多い。例えば〈XMDFファイルは独特のソフトウェアでテキスト変換したもので、仕様は非公開〉という一文は少なくとも2つの誤認、もしくは嘘が含まれている。かねての持論を喧伝したくて中間フォーマットやXMDFに牽強付会したと理解すべきか。
[*6]……「電子書籍中間(交換)フォーマット統一案とIEC62448改訂」(http://www.bunka.go.jp/chosakuken/digital_network/gijutsu_06/pdf/shiryo_6_1.pdf
[*7]……この原稿を執筆している2010年10月26日現在。なお、議事要旨を除く配布資料は、以下から入手可能(http://www.soumu.go.jp/main_sosiki/kenkyu/shuppan/30752_1.html)。
[*8]……「平成22年度「新ICT利活用サービス創出支援事業」(電子出版の環境整備)に係る委託先候補の決定」(http://www.soumu.go.jp/menu_news/s-news/01ryutsu02_01000005.html
[*9]……「別添1 平成22年度「新ICT利活用サービス創出支援事業」に係る委託先候補」(http://www.soumu.go.jp/main_content/000086456.pdf
[*10]……「別添2 平成22年度 新ICT利活用サービス創出支援事業 採択案件(10件)概要一覧」(http://www.soumu.go.jp/main_content/000086457.pdf

2010/10/29 06:00


小形 克宏
文字とコンピューターのフリーライター。2001年に本誌連載「文字の海、ビットの舟」で文字の世界に漕ぎ出してから早くも10年が過ぎようとしています。知るほどに「海」の広さ深さに打ちのめされる毎日です。Twitterアカウント:@ogwata