期待のネット新技術

Broadcomが先導する、光電融合のキーテクノロジー「CPO」の先進性と課題

Silicon Opticsの現状(2)

 ネットワーク、およびコンピューターの光信号化の現状を紹介するこのシリーズで、前回はIntelのSilicon Opticsに関するロードマップを紹介した。実はIntelに関してはまだ説明していないことがあるのだが、それはあとにするとして、今月取り上げるのは、Broadcomのロードマップである。

多くの主要企業の製品で物理設計を請け負うBroadcom

 特にNetwork周りでは同社の存在感は結構高いと思うのだが、現在のBroadcom(Broadcom Ltd.)はもともとAvago Technologiesという、旧HPのSemiconductor Products部門が独立した企業で、元々さまざまなWired/Wireless Network向けの製品を扱っていたが、HPからの独立後には特に同領域向けのアナログ半導体のラインアップを強化している。

 そのAvago Technologiesが2015年に買収したのがBroadcom Corporationである。同社もやはりNetwork向けの製品を扱っているメーカーだったが、Avago Technologiesと比べるとデジタル半導体の比率が高かった。合併後はBroadcom Corporationの名前を引き継いでBroadcom Ltd.としたが、そんなわけで同社はNetwork向け製品を包括的に提供できる一大ベンダーに成長した。特にトランシーバ向けのDSPやPHYと、Network Switchの分野での存在感は大きい。

 あと、Avago Technologies時代にLSI Corporation(旧LSI Logic)を買収しており、このLSI Logicのビジネスの一つに「ASICの設計・製造支援」があった。俗にデザインハウスなどと呼ばれるビジネスだが、顧客の設計を手伝って製造まで持ってゆくためのものである。

 LSI Logic時代で有名なのが、富士通の京コンピュータだ。この時富士通としては初めてTSMCの45nmプロセスを利用して製造を行ったが、富士通自身はTSMCを利用した経験がなかった。そこで論理設計(回路の論理レベルの設計)は富士通が行ったが、物理設計(その回路を実際のLSIに実装する設計。配置配線などとも呼ばれる)をLSI Logicに委託して製造している。この流れをBroadcomも引き継いでおり、現在もさまざまな企業の物理設計や製造の委託を行っている。有名なところでは、GoogleのTPUは論理設計こそGoogleが行っているが、物理設計は全部Broadcomと言われている。

 Broadcomは自社製品、特に高速なEthernetのPHYやDSP、それとEthernet Switchを自社で設計・製造している関係でTSMCの先端プロセスに関するノウハウを蓄えており、このノウハウを生かして物理設計などのサービスを行っている(図1)。

図1:Broadcomの物理設計サービスの例。これはAI向けプロセッサーの例で、実際のAI処理の部分は顧客が設計するが、それ以外の部分は全てBroadcomが提供し、設計および製造までを引き受けることができるとする。出典はBroadcomが2024年3月に公開した"Enabling AI Infrastructure Investor Meeting"

 同じように、やはりNetwork向けを主眼とし、おまけに設計サービスを行っていた会社を買収して設計サービスを行っている企業にMarvellがあり、こちらもMicrosoftとかMetaといった企業のASICの設計・製造を請け負っているとされる(あくまで社名は噂レベルで、公式に同社が認めたわけではないが)。

消費電力を1/3以下に抑えるCPOの先駆者

 話が逸れたが、そんなわけでBroadcom(やMarvell)は、ほかの企業に先駆けてCPO(Co-Package Optics)に取り組んでいる。理由の1つは、同社の製品は現時点でも光Ethernet製品を大量に取り扱っており、今後はさらに接続の光化が進むと想定しているためだ。

 特に問題なのはSwitchで、扱っている信号そのものは光Ethernetながら、実際にSwitchの中身は電気信号で処理がされている。なので、光と電気信号の相互変換の必要性がそこら中で発生することになる。この光と電気信号の相互変換に要する消費電力が馬鹿にならない、というのが最初の問題である。次の図2がその効用を示したスライドであるが、CPOを利用することで、従来のPluggable Ethernet Moduleの消費電力を1/3以下(14W→5W、25W→8W)まで抑え込める点を特徴としている。

図2:LPOは次に説明するが、DSPを1か所に集約することで消費電力の若干の低下を実現させている。ただ未だに標準化の道筋が立っていない。こちらも出典はBroadcomが2024年3月に公開した"Enabling AI Infrastructure Investor Meeting"

 このCPOとLPOの違いは、FiberMallのブログで公開されている「CPOとLPOの違いは何ですか」という記事に詳細にまとまっているので、参考資料として紹介する。両者の特徴は、次のように整理できる。

  • 電気信号⇔光信号の変換を含む全てのモジュールをパッケージ上にまとめてしまい、直接パッケージから光信号が出せるようにするものがCPO
  • 電気信号⇔光信号の変換はPluggable Module上に残し、ただしPluggable Transceiver Moduleの方からDSPを省いたものがLPO
図3:CPOは全てのモジュールがパッケージにまとめられ、LPOはPluggable Moduleが残されている、というイメージとなる。出典はFiberMallの「CPOとLPOの違いは何ですか

 そもそも従来のPluggable Transceiver Moduleの消費電力が大きいのには、次の2つの理由がある。

 まず、ASIC(SwitchだったりEthernet Controllerだったり)とTransceiver Moduleの両方にDSPが入っており、この消費電力が大きい。

 次に、信号が高速になると、ASICとTransceiver Moduleの間の電気配線に伴う消費電力が馬鹿にならない。これにはさらに2つの要素があり、1つは信号そのものが高速になり、またPCB(プリント基板)上で数十cmも信号を引き回すため、この信号駆動に要する消費電力が大きい。もう1つがGearBoxの存在だ。例えば200Gbps/Laneの光信号を出すとして、電気配線の方は頑張っても100Gbpsだし、何なら50Gbpsくらいまで下げた方が好ましい。ということは50Gbpsの電気信号と200Gbpsの光信号を相互変換する前に、まず電気信号レベルで4:1のGearBoxを入れ、4対の50Gbpsの電気信号を1対の200Gbpsの電気信号に変換してから、電気信号と光信号の変換を行う必要がある(受信の場合も同じで、まず200Gbpsの光信号を200Gbpsの電気信号に変換し、それを1:4のGeabox経由で4対の50Gbpsの電気信号にして送り出すかたちになる)。

 このGearBoxの消費電力が馬鹿にならない。図4は2024年のHot InterconnectsにおけるArista NetworksのAndy Bechtolsheim博士(創業者兼Chief Architect)の"Can Interconnects Keep up with AI? YES."という招待講演の中のスライドであるが、送受信そのものに要する消費電力よりGearBoxの消費電力の方が大きいという試算になっている。

図4:この8Wという数字はTransceiver Moduleの消費電力だけの話で、これにPCB上の配線やASIC側の消費電力も加味すると、結構な消費電力になることに注意されたい

 このあたりが、CPOを使うと一気に解決ができることになる。まずCPOではDSPがASIC側にまとめて全部集約されるのでDSPの数が減る。またパッケージ上にOptical Moduleが搭載され、長くても数mm程度の距離でASICと接続される。

 この距離であれば200Gbpsぐらいの信号でも通すことは可能だし、なにしろ数mmだから駆動に要する電力も低く抑えられる(信号の電圧を低めにしても十分伝達できる、というのが主な要因である。数十cm引き回すとなると、それなりの電圧にしないと信号が減衰してしまう)。

 また、200GbpsぐらいまでであればGearboxを入れずに電気信号と光信号を1:1で変換できるし、仮に1600Gbps/Laneの光信号であっても8:1のGearboxで済むから、相対的にGearboxの消費電力も下げることが可能になる。結果として、図2で示したように大幅な消費電力削減が可能になるというわけだ。

CPOが抱える問題とLPOの可能性

 ただ、CPOには結構深刻な問題がある。それは「パッケージ上のOptical Moduleで規格が一意に決まってしまう」ということだ。現在のSwitchが、フロントパネルにTransceiver Moduleを装着するかたちになっているのは、複数の規格のEthernetをModuleの入れ替えだけで対応できる点が大きい。

 以前こちらの記事などでも説明したが、IEEEで標準化をしようとした800GBASE-Rシリーズだけで、800GBASE-KR8/CR8/VR8/SR8/DR8/DR8-2(100Gbps/Lane×8)、そして800GBASE-KR4/CR4/DR4(200Gbps/Lane×4)と、9種類もある。このうち銅配線ケーブルを利用するKR8/CR8/KR4/CR4を勘定から外しても、5種類である。そしてMMFを利用するVR8/SR8とSMFを使うDR8/DR8-2/DR4では、そもそも利用する波長帯そのものが異なる(MMFは850nm、SMFは1310nm)。

 ということは、最低でもMMF用とSMF用で別々のOptical Moduleを搭載しないといけないことになる。パッケージ側のOptical Moduleを自由に付け替えできるような構造にはできないので、ということはSwitchに関しては最低でもMMF用とSMF用の2種類を用意しないといけないことになる。

 もっと言うなら、従来だと1つのSwitchの中の半分はRack内接続用にSRを利用し、残りはRack間接続用にFRを利用する、なんていう自由な構成が可能だったが、CPOだとこうした自由度が完全に失われてしまうことになる。

 このあたりの自由度が残されているのがLPOである。LPOでは構造的にOptical ModuleがASICから独立しており、なのでOptical ModuleをTransceiver Moduleとして提供することで従来と同じようにユーザーが任意の規格のEthernetを選択できるようになる。その一方で、引き続きASICとTransceiver Moduleの間には数十cmの電気信号が引き回されることになる。

 もっと言えば、Transceiver Moduleの側にDSPを持たないということはつまり、送信側と受信側のそれぞれで、次のような問題が起こる。

  • 送信側:数十cmの電気配線の引き回しで劣化した信号を補正する方法がないので、ASICの側でそのぶんもまとめて補正を行う必要があり、信号補正の難易度が上がる
  • 受信側:元々の光信号レベルでの劣化に加え、Transceiver Module→ASIC間での電気信号の配線引き回しに伴う信号劣化が上乗せされるので、さらに強力な補正が必要になる

 このようなこともあって、たぶん従来のPluggable Transceiver Moduleを利用する場合と比較して、ASICとPluggable Transceiver Moduleまでの間の配線距離を短縮する必要がある。具体的に言えば、あまり多ポートのSwitchを構成するのはかなり難しくなる(ポート数が増えると、どうしても配線距離が長くなるため)。現状、LPOに関してはまだ標準規格に相当するものが存在せず、試作品というか提案用のプロトタイプがいくつか出ている段階である。

 そしてBroadcomは、まずSwitchにCPOを適用させ、その先ではChip-to-Chip接続にCPOを適用することを考えている。IOWNで言うなら、現状のPluggable Ethernet ModuleがIOWN 1.0、CPOを適用したSwitchがIOWN 2.0相当、そしてその先のChip-to-Chipは、IOWN 3.0の手前になるIOWN 2.5相当ぐらいを目指している。

 ちょっと前書きが長くなりすぎてしまった。今回はここで一旦終わりにして、次回もう少しBroadcomの実装を紹介したい。

大原 雄介

フリーのテクニカルライター。CPUやメモリ、チップセットから通信関係、OS、データベース、医療関係まで得意分野は多岐に渡る。ホームページはhttp://www.yusuke-ohara.com/