2024年のinterop tokyoのブース展示及びShownetに供出した製品の回収を終えて昨晩遅く帰着しました。
今年も多くの皆様に弊社ブースにお越し頂き様々なお話をさせて頂きました、その中で敷設してしまってどうしても使わなければいけないマルチモードファイバーの活用についての質問が何件かあったので、相談内容と回答例を整理してみます。
「敷設してあるMMF」と言っても様々なパターンがありますので、本文では典型的な一例に固定してみます。
変調速度 | lane毎の伝送容量 | OM3での想定距離 | lane数 | 芯数 | |
---|---|---|---|---|---|
800G SR8 | 50G | 100Gbps | 30m | 8 | 16 |
400G SR4(VR4) | 50G | 100Gbps | 30m | 4 | 8 |
400G SR4.2 | 25G | 50Gbps | 70m | 8 | 8 |
400G SR8 | 25G | 50Gbps | 70m | 8 | 16 |
200G SR4 | 25G | 50Gbps | 70m | 4 | 8 |
HGX側に1x400G SR4 OSFP-RHSトランシーバー、Edgecore側に400G SR4 QSFP-DD
仕様上はOM3で 30m maxなのでアウト、OM4であったとしても50m maxなのでギリギリ。
ここは伝送速度を落として200G SR4での接続を推奨します。しかし、200G SR4のOSFP-RHSトランシーバーを用意しているベンダーはほぼないと思われますので。400G SR8 OSFP-RHSを使用し、 MPO-16から半分の配線をMPO-12に変換するパッチケーブルを用意し、トランシーバーの機能の半分を使わない構成となります。スイッチ側も機能の半分を使わない構成になる可能性があります。
NVIDIA DGX H100のCX7が二枚接続されたOSFP-RHSポートであれば、2x200Gとしてすっきりはします。
伝送の仕様を眺めると、400G SR4.2が使えそうな気がします。確かにファイバーの芯数と距離は要件を満たしている。しかし、トランシーバーの観点からは問題は大きいのです。
CX7側からは4x100Gの電気信号が来ます、これを8x50Gの光信号に変換しなくてはなりません。このようなLANE速度を変換する機構をGEARBOXと呼び、QSFP-DDの400G DR4トランシーバー等で実装されています。それと同じことを行うOSFP-RHSの1x400G SR4.2もしくはSR8があれば良いのですが現在弊社以外でも見当たりません。
作れなくは無さそうに思えるし、世界的にも需要があるような気もするのでどこかのベンダーが作る可能性があるかも知れません。特に、OSFP-RHSを備えたCX7 NICが数多く出回るようになると。
私が顧客の立場だったら本文の大前提であるマルチモードファイバーの活用を大否定してしまいますがOSFP-RHS 400G FR4一択なので今のところ新しい製品企画書を作る予定は有りません。
"SR"は10G SRの様に、100mの最大伝送距離を示すものなので。高価なOM4を用いても100mを保証できない伝送方式には"VSR"もしくは"VR"の表記を使用すべきという話です。
表記名 | OM3 | OM4 | |
---|---|---|---|
ARISTA | 400GBASE-VSR4 | 30m | 40m |
NVIDIA | 400G SR4 | 30m | 40m |
IEEE 802.3db | 400GBASE-SR4 | 60m | 100m |
IEEE 802.3db | 400GBASE-VR4 | 30m | 50m |
ARISTAのドキュメントを眺めるとIEEE的には400GBASE-VR4だがARISTAはIEEEでの仕様名が決まる前にVSR4として製品化したので名称を変更しないと言う事でしょうか。
NVIDIAがOM3 30m,OM4 50mとしながらSR4表記なのは意味不明です。
IEEE等の仕様に記述されている最大ファイバー長はコネクターロスや機器の特性のブレを含んだかなりマージンのあるものです。機器がケーブル長を測定して特定の長さ以上では異常を検出して動作を止めるような事は有りません。伝送規格の長さ制限は時間的制約で長さが決まっているものはかなり厳格ですが、減衰などの伝送特性の悪化の兼ね合いで距離が設定されているものは実際の限界はかなり緩やかです。
従って、仕様上30mであっても50mで動作する可能性は高いです。しかし、安定運用を求められる設備で仕様書に記載されている数値を超えているのを認識しながら運用を継続するのは様々なリスクを伴います。
800G SR8は16芯ですので、普通に考えればMPO-16もしくはMPO-24コネクタです。しかし、MPO-12以外のコネクタを末端のパッチコードで用意するのは多くの人々が避けたいと考えています。そして、2024年初頭の段階では物理的な800Gのポートであっても2x400Gとして利用される事が多く、その場合は2xMPO-12コネクタをトランシーバーの筐体サイズからするとかなり無理があるのですがなんとか収めた製品が数多く使われています。2xMPO-12コネクタをそのまま並行で使用して800G SR8として運用する事も出来るので、MPO-16を使わない方が良いのではないでしょうか。
この話はシングルモードの800G DR8も同様で、トランシーバーメーカーとしては二つのコネクタタイプの製品を用意するだけですが、顧客視点でSMF MPO-16はなるべく手配したくないはず。1.6Tbps等も8 lane構成から実装が始まりますので短命とはならない見込みですけど。
そもそも、「たかだか二倍」なので800G容量のポートであっても2x400Gとして使う事しか考えていないと言う声も多い様子。