期待のネット新技術

1.0E10年のMTTFPAを維持、1.0E-14のBER Targetには高コストなFECが必要に

【光Ethernetの歴史と発展】

 Ethernetというか10GBASE-Tに関しては、2017年から【10GBASE-T、ついに普及?】と題し、全11回と番外編2回をお届けした。だが、ツイストペアによる銅配線のEthernetは10GBASE-Tまでで、25/40GBASE-Tはまだまだ実用化には至っていない。

 【アクセス回線10Gbpsへの道】とも一部は被るかもしれないが、ここでは光ファイバーを利用する“光Ethernet”を紹介していこう。

「光Ethernetの歴史と発展」記事一覧

 前回の2021年4月分ミーティングに引き続き、今回は「IEEE 802.3 Beyond 400 Gb/s Ethernet Study Group」の5月分の内容を見ていこう。まず議長から発表された今後のタイムライン見込みが以下のスライドだ。

NesComは"New Standards Committee"の略。出典は"Study Group Timeline"

 その前提となるのが以下の点であり、今後はこれに向けて議論を収束させていく作業が行われる予定となった。

  • 6月のミーティングが仕様拡張の提案に関するデッドライン
  • 同時に6月のミーティングにおいて、2021年11月の総会に向けた再提案を実施
  • 9月にStudy Groupは終了し、PAR/CSD/Objectiveなどのドキュメントを承認

 その後、問題がなければ11月の総会でStudy Groupの提案が承認されてTask Forceを形成。2022年1月から標準化の作業がスタートされることになる。

エラー自体の頻度より、エラーパケットをフラグなしで通過させる頻度が問題

5つ目の最後に記された"Pete Anslow's presentation"は、IEEE P802.3cn Task Forceで、Chief EditorでもあるCienaのPete Anslow氏が提出したプレゼンテーションのどれかを指しているのだろう

 さて5月の投票では先送りとなったBERに関する議論については、2つの発表が行われた。1つ目はCiscoのMark Gustin氏による"Thoughts on the BER Objective"である。

 まず、前回までの簡単な振り返りの後、BERの議論に際してはエラー率そのものではなく、誤パケットの平均受信間隔を表す「MTTFPA(Mean Time To False Packet Acceptance)」を利用して判断すべしとした。

 そして、10GbE以降はBERよりもMTTFPAを中心にして設計がなされており、BERを必要以上に下げなくても、MTTFPAは十分確保できる(ラフに言えば、BERを1.0E-9あたりにすれば、MTTFPAは1.0E10年となり、宇宙の歴史(おおよそ138億年というのが現在の説らしい)とほぼ同等(100億年)ほどになるとしている。

 要するに、Ethernetのとある1bitがエラーとなる頻度よりも、どの程度の頻度でエラーのあるパケットをエラーフラグなしで通過させてしまうかが問題になるというわけだ。

「MTTFPA」はこちらの回でも出てきた。
3段落目のMTTPAは、MTTFPAの間違いかと思われる

 ちなみに、最後の段落に出てくる"Rick Walker and company set the bar"の個所は、IEEE P802.3ae Task Forceの2000年7月のミーティングでAgilentのRick Walker氏ほかが提示した"64b/66b PCS updated 6/30/2000 state machines modified 7/17/2000"というプレゼンテーションの中で、BERが10E-9未満であれば高い確率でFrame Syncが成立しているので、MTTFPAイベントが発生しても迅速に対応できるが、BERが10E-4以上であればCRCエラーによるパケットの誤認識を防止するためにFrame Syncを無効にする必要があると説明している。

 ここでWalker氏はMTTFPAイベントとしているが、要するにエラーが発生してフレーム再送を行う(必然的にこの時点でFrame Syncが外れるので、再同期を掛ける必要がある)ため、これがある程度以上の頻度になるようなら、Frame Syncを外した方がいいという意図である。

BERは1.0E-13程度に抑えられれば、MTTFPAは1.0E10年を維持

 話を戻すと、こちらで触れた「IEEE 802.3ae」では、BERのターゲットを1.0E-9程度に設定し、これでうまくMTTFPAが1.0E10年となる、となっていたわけだ。

 ただ、これは「10GBASE-R」での話で、800Gではそのまま適用するのは無理。では、800Gで同じくMTTFPAを1.0E10にするために、BERをどの程度にすべきかとの試算が以下だ。

もっともこの計算、なぜこんなにSafety Factorを大きく取らないといけないのか、よく分からない

 結論から言えば、RS(544,514)FECを利用するのなら、BERは1.0E-13程度に抑えられれば、MTTFPAは1.0E10年を維持できる、としている。

 この試算を基に、BERは1.0E-13をターゲットにすれば十分であり、より低いBERをターゲットにするのは消費電力の観点から好ましくないとして、バランスを重視すべきだと結論。Study Groupに対しては、BERターゲットを1.0E-13以上とし、より低いBERターゲットを設定するかどうかはTask Forceでの課題にすべきと提言した。

"saving power is more important than further improving of the BER"が一番言いたいことであったようだ

 ちなみに、より低いBERターゲットが必要かどうかは、FECの構成やオーバーヘッド、BER改善のトータルコストなどをきちんと試算する必要があるとしており、Study Groupではそこまで踏み込まないことを念頭においた提言となっている。

1.0E-14のBER Target実現には高コストで強力なFECが必要

 さて、BERではもう1つ、Xiang He、Hao Ren、Xinyuan Wangの各氏(いずれもHuawei)による"FEC Architecture of B400GbE to Support BER Objective"というプレゼンテーションも行われた。前回で紹介したStraw Poll #5/#6の結果からも分かるように、BERについては、まだ意見を決めかねている状態だ。その理由は以下に集約されるとしている。

  • BERが1.0E-13ではエラーが多すぎる
  • BERが1.0E-14だと強力なFECが必要になり、そのコストが無視できない
先のプレゼンは、「そもそも1.0E-13でエラーが多すぎるというのは誤解だ」というものだったが、こちらは「それはそれとして」というアプローチ。以降の出典は全て"FEC Architecture of B400GbE to Support BER Objective"

 そこで、いくつかの強力なFECを利用した場合の実際のコストを試算した結果が示されている。具体的には、3グループ計12種類の組み合わせで試算が行われた。ちなみに、この12種類については、実際にどこからどこまでをFECでカバーするか、も検討する余地があるとしている。

赤色の4つはシミュレーションによる結果(7nmプロセスで合成)としている
最もシンプルなのは一番上のEnd-to-end FECで、次いで実際の通信路のみにBCHを追加するEncapsulated concatenated FEC、最後がAUI/Opticalで別々のFECを利用する一番下となる

 さて、まずOverallを見ると、とりあえずFECなしではSNRが20dBでもBERは5.0E-5といったところで話にならない。RS単独だと17.5dBあたりでやっとBERが1.0E-13、2-way RS+HD BCHで16.5dB、という具合に(当たり前だが)FECを強化するほどSNRが低くてもBERで1.0E-13を達成しやすくなる。

 ただし、最も強力な2-way RS+SD BCHでも15.7dB程度が必要というあたり、単にBERターゲットを満たすSNRだけで判断するのは難しい。つまり、FECを強化しても、SNRのマージンの増え方がそれほど大きくないため、どこでバランスを取るか? という問題になってくる。

"*"の付いた項目はシミュレーションでの結果だという

 ということで、以下6つのスライドが実際の組み合わせだ。最後の「3-3,Segmented FEC」は800GBASE-FR/LR向けで、「1×800G」とは記されているが、実際にはWDMを使った(8×100Gと4×200Gの両方を想定している)構成だと思われる。

100G LaneをEnd-to-End FEC、2-way RS
200G LaneをEnd-to-End FEC、Single RS
200G LaneをEncapsulated concatenated FEC、RS+SD BCH
200G LaneをEncapsulated concatenated FEC、RS+SD BCH(SD-BCHは光ファイバー区間のみ)
200G LaneをSegmented FEC、RS+SD BCH
800G LaneをSegmented FEC、2-way RS

 さて、100G×8ではBERが1.0E-13で十分との結果になっており、これはまあ当然のことである。問題はOptical BER(光ファイバー経路でのBER)やPost-FEC BER(FECを通し終わった後のBER)によっては、大丈夫とは言い切れないケースがあること。これは光ファイバーに何を使うか、実装をどうするかといった点に影響を与えることになる。

 それはともかく、この6枚の結果をまとめたのが下記の表だ。中央の青い枠が、FECに絡むエリアサイズ(7nm相当のプロセスで実装した場合の回路面積)と、FECにおけるトータルのレイテンシーが最も低い組み合わせである。

この結果は、2-way RS(544,514)+SD BCHを使えば、BER Targetは一応1.0E-13のままでも200Gレーンは実装できるかたちだ

 つまり、ラフに言えば 「2-way RS(544,514)にSD BCHを組み合わせるのが、コスト的にもLatency的にも適切」 ということになる。

 HD BCHはレイテンシーこそ53.6nsとやや少ないし、エリアサイズは4.05平方mmと相対的に小さい一方で、BER Targetで1.0E-14は厳しい(1.0E-13なら可能)というあたり、BER Targetが1.0E-13で決定されない限り、選択肢からは外れそうだ。

 ちなみにBER Targetの1.0E-13と1.0E-14の違いが以下のスライドだ。要するにFECに入る前の、光ファイバーのノイズ(AWGN:Additive White Gaussian noise、日本語では「加算性白色ガウス雑音」と呼ぶが、自然界のランダムノイズを模したノイズモデル)に起因するBERを2.60E-03から2.37E-03まで下げれば、トータルでのBERが1.0E-14を実現できる、としている。

問題はそのpre-FEC BERを2.60E-03→2.37E-03とするのに、どれだけのコストが掛かるかだろう。

 このプレゼンテーションでは特に提言は出ていないが、FECを工夫すればBER Targetとして1.0E-14を指定することそのものは可能、としている。

大原 雄介

フリーのテクニカルライター。CPUやメモリ、チップセットから通信関係、OS、データベース、医療関係まで得意分野は多岐に渡る。ホームページはhttp://www.yusuke-ohara.com/