第3回 符号化文字集合(JCS)調査研究委員会WG3 議事録 日時 平成8年6月24日(月) 14:00--18:00 場所 桔梗ビル B会議室(3F) 出席 芝野(主査)、池田、氏原(obs)、翁、佐伯、笹原、佐藤、高野(obs)、坪倉、前沢、金子、村田、森光、渡辺、小笠原(事務局)、徳永(幹事)、森、山本(日立、小池後任), 豊島(幹事),森(日本IBM小田後任)、小田(工技院) 欠席 太田、松沢 資料 JCS 2-3-00(事務局) 第3回議事次第 JCS 2-3-01(豊島幹事) 第2回 JCS/WG2 議事録 JCS 2-3-02(豊島幹事) 議事録関連情報の補足(議事録外) JCS 2-3-03(事務局) 進捗状況・スケジュールの確認 JCS 2-3-04(事務局) 符号化文字集合調査研究委員会wg2名簿 JCS 2-3-05(豊島幹事) 7ビット及び8ビットの2バイト情報交換用符号化漢字集合 ver 1.20 JCS 2-3-06(小田←佐伯) (NTT電話帳統合システム) コード・ブック(音読み順) JCS 2-3-07(小田←佐伯) (NTT) 区点番号順漢字一覧表 JCS 2-3-08(小田←佐伯) (NTT) 音訓順漢字一覧表 JCS 2-3-09(小田←佐伯) (NTT) 部首別漢字一覧表 JCS 2-3-10(小田←佐伯) (NTT) 総画数順漢字一覧表 JCS 2-3-11(笹原) 「典拠未詳字の調査状況」ののちに判明した事 JCS 2-3-12(笹原) 「日下部表」出自の異体字 JCS 2-3-13(芝野主査) JIS漢字の拡張計画 JCS 2-3-14(芝野主査) 用語関連追加修正 0. 委員の交替 小田委員(日本IBM)退任、後任森委員(日本IBM)。 小池委員(日立)退任、後任山本委員(日立)。 田嶋一夫オブザーバ退任。但し、親委員会委員は継続。 1. 議事録確認 1-0 訂正 「外字標準化」は,「進行」→「概念はあるが,今の処進行していない」に訂正. 1-1 新規格名称は, 第1水準第2水準 : not subset 第3水準第4水準 : subset で紛らわしい. ←3&4は ISO directory に入れる別の集合. 1-2 関連報告 1-2-1 新JIS 開発文言 revised version (JCS 1-2-2 教科書典拠 国研水谷所長と協力して行なう。(芝野) 1996年7月1日(芝野、小田、氏原)。 データベースは国研に於て維持する。教科書会社との協力も得易い。 長期的にも役立てられる。 1-2-3 文部省教科書課関連(氏原) 小田(MITI)委員と氏原委員が教科書課平林補佐と懇談。 ・外字資料は、検定補助資料なので、他目的の流用は問題。 ・検定後の修正は反映されていないので、外字資料がそのまま実質データではない。 教科書協会への依頼(INSTAC 名、相手方窓口は漆原氏) 1-2-4 諸橋初版巻1(昭和18、活字印刷)を大修館より拝借。(芝野) 1-2-5 不明字追跡 朝日新聞記事の反響 碩の誤認。 (示祢の誤認)1人、不明1人、トネザキ氏(東京朝日学芸部)は示祢。 多賀町あけん原、現地では山女、但し「山一女」に作る地図あり。 1-2-6 「用語」の EDITORIAL 修正 2. div-A ad hoc 7月20(土)、21日(日)。 11:00- 場所は芝野主査のオフィス ? 包摂規準及び附属書2。 3. X0213 関連 1 公開用文言 JCS2-3-13 (HTML version) 本日 finalize し、親委員会で郵送審議。 8040x GBK, UHC のアドレス→ 8140x の シフトJIS、中国のBGK, 韓国のUHC のアドレス 開発期間は2年間とし,.... →2年間とする。 第3水準 2000 字、第4水準3000字。3水∩4水= null と定義変更する。 2. problems 1. 「この字が欲しい」を募るかどうか 2. 朝日文字を入れるか (cf. NTT )。現状ではただの文字表で、同定情報を欠く。特に頻度情報が欲しい。 3. 記号類も、公募するか。 4. 過去の拡張時には、提案を募集したが、実質的には reply は無かった。 5. 記号類の追加には、WG3 資料は同定資料が不足。 発音記号は、教科書検定側からの input あり。(アメリカ式、非IPA) 6. base set を作ってその補完という形では拙いのでは。 7. 朝日文字等は、包摂範囲外のものがあるので、欠けている事は明白。 宿題 1) 公募の方法、するかしないかも含む 2) 記号類の典拠情報(何が記号類の本当の典拠か) 4. 用語修正 see JCS 2-3-14 1. \Subsection{受信装置} \SectionLabel{comformance-device-receiving} % 受信装置は, % CCデータ要素を構成し %2.2 \JisSecref{comformance-of-interchange} に適合する任意の符号化文字を受信し, % 解釈することができなければならない。 更に, 採用した符号化文字集合の対応する文字を 利用者がその文字集合の中から識別し, % 互いに区別できるように利用者に渡さなければならない。 2. 5. 未詳字調査 1. 作字の際の「影」の実例、他にもあり (妛もこの例) もっとも、「山女」「山一女」包摂しなくてはいけないか 2. 屶 従来山+力しか無かったが、山+刀がある。 1987.02 除去 p0197-6 宮城県桃生郡桃生町\ruby{給人}{きゅうにん}町 通称\ruby{屶}{なた}\ruby{巻}{まき} 3. 誤写によって削除されてしまった字 竹+卷(うつぼ)→竹+大+己→不明字として削除 4. 堽 右下が4画のものは、誤字。 出典は国土。5画。 対応分析結果は、大漢和(4)←康煕(4)←字彙補(5) 5. 拡張新字体は78jisが作ったか 「木国」←原典の国土は「木國」 萢(やち)←原典の国土は、包むは「己」ではなく「巳」 6. 礦・砿 対応分析結果が、勝手に「石広」にした為に、見掛け上共存したか。 7. 鷏・鷆、麩・麸の共存 同上 8. 檜・桧 これは、国土自体に両方ある。 9. 日下部表(2-3-12) 4字は、この表まで遡れ、この表しか用例が無い(官報を除く)。 6. 原案修正 1. 適用範囲 「漢字集合」の備考 更に、用語の定義に追加し、備考は用語の定義をポイントする。 漢字集合(Kanji set) この規格で規定する図形文字集合の全体。 参考 平仮名、片仮名、ラテン文字などの非漢字も含む。 2. 用語の定義を50音順にソート 3. p.11 5.5.2 (1) enumeration マクロのミス 4. p.49 図1 7F DELETE → 保留域と修正 (X0201 ではないので DELではない) DOS の実装がどうなっているかによる。 5. 附属書中の section 参照に「この附属書の」を付ける Z8301 違反ではあるが、こちらの方が分かりやすいので OK。 6. 5.6 包摂 (1) 5.6.3 包摂規準文言 脚注第2案を下記に変更。直前の文言も修正。 ------------------ \Section{漢字字体の包摂の規準} \SectionLabel{equivalence-of-character-principle} % ここで規定する漢字の字体の包摂規準は, 一般に用いられている漢字の字体と この規格でそのビット組合せを規定する図形文字との 対応を示すためにだけ用いるのであって, 漢字の字体そのものに対しては, いかなる規準も与えるものではない。 ここで規定する漢字の字体の包摂規準を部分字体として演繹的に 用いることによって, 新たな漢字字体を作り上げてはならない。 この規格の各区点位置に対応する字体は, その構成要素である部分字体を次に示すものによって置き換えた字体も包摂する。 ただし, *ある*包摂規準を適用すると, 他のいずれかの区点位置の漢字の字体をも包摂してしまう場合は, その包摂規準を適用してはならない。 ------------------- (2) 包摂規準の下位分類化による明確化 (1.8) 開きの上下と八屋根の有無は分ける (2.3) 土の抜け有無と、点の有無は分ける (3) (7)「その他」規準は、他の規準へ配置換えして解消 (4) (8) b 類形異字は、ここに置く。何故なら、字体の問題だから。 eg. ヒメ・シン。 同形異字は、字体のレベルでは同一であるので、 そもそも包摂のしようが無い。 eg. ゲイ・ウン。 もし、こうするなら、用語の定義「包摂」をこれに応じて改訂しなくてはいけない。(ヒメ・シン、ゲイ・ウンが同列に挙げられている) (5) 文字全体が包摂に参加する例は、全て見直さないといけないかも。 例 ヒメ・シン。 (6) 包摂規準の性格が変りつつあるか ベースは、デザイン差であった筈。 (デザイン差は、部分字体に対するもの)。 典拠を沢山付ける為に、包摂規準が増えて仕舞った。 (7) 文字の unification が、行なわれるレベルが複数あるとして、 文字→常用漢字→X0208 という多段階マッピングだとすれば、 必ずしも、常用漢字表外字を律儀に包摂しなくても宜しいと考えられる。 即ち、「教」(5.1)で旧字体が表現出来なくて宜しい、表現したかったら まず常用漢字に置き換えよ、とする考え方。 両者のマッピングの差を見分ける方法は ? デザイン差と見られるならば、文字から直にmapping されている。 (8) 辞書典拠に無い文字まで含めるべきか。eg.「木国」vs「木國」 (9) 包摂規準は、そもそも何の為にあるのか。 字書典拠による、文字同定。←authentic referenceとして必要。 包摂が明確なものは、制定時資料と改訂資料。 7. 今後のスケジュール 1. 今、包摂規準の全体を見直している時期か ? 8-b だけの解決は出来ないか。←それは無理である。through rework が必要。 却下。 2. 包摂規準は、次回 ad hoc で処理する。 包摂規準の見直しとは、 文字の unification が、行なわれるレベルが複数あるとして、 X0208 内部での unification と明確化出来るものを選び出す事。 X0208 内部での unification と明確化する為には、X0208内の 整合性を前提に立てる。 3. 最新版の異体リストを流す 益山委員