NDIVIA DGX H100は最新AIサーバーとして注目されている製品です。インターコネクト用として4ポートのOSFP-RHSを備えていますが、二つのConnectX-7カードの出力が束ねられた変わった仕様です。つまり物理ポートは4ですが、一つのポートに二つのインターフェースが割り当てられている論理構成的には8と言う事です。
InfibiBandとEthernetどちらでも利用可能ですが、Ethernetとして利用する場合は多くのスイッチがOSFPをサポートしていませんのでQSFP-DDもしくはQSFP-DD800への変換する形態になります。
純正のトランシーバーとして二つのMPOコネクタを備えた800G SR8が用意されています。この純正トランシーバーを使い対向に400G SR4のQSFP-DDトランシーバーがあれば良い訳ですが、400G SR4はかなり特殊で弊社でもラインナップしていません。
OSFP 800G DR8を刺して、QSFP-DD 400G DR4をスイッチ側に使う方が現実的です。短い距離ではAOCを使いたいところですが、LANE速度が異なりますので単純配線のブレイクアウトAOCはQSFP112となってしまいます。
QSFP56を備えるSN4600と400G OSFP-RHS/2xQSFP56 AOCを使用しての接続がNVIDIAが提示している接続例の一つです。
NDIVIA型番MMS4X00は波長等から400G DR4と相互接続性があると推察されます。
OSFP SpecificationのOSFP-RHS。ヒートシンクを削除しmoduleの厚みを薄くすることによりPCIeカードの厚みに収まるようにしたmoduleです。放熱のためのヒートシンクをCAGEに備えている必要があります。
スイッチ側が800G対応(QSFP-DD800)であるなら、束ねたままの接続になります。光トランシーバーの観点からは800Gの単純接続です。但しスイッチ側の設定は2x400Gにする必要があります。
しかし、800G DR8も2023年3月時点では簡単に入手できません。より現実的なのは、OSFP-RHS 400G DR4/FR4を刺してlane速度を56Gbpsに減速設定しスイッチ側では2x200Gのbreakout設定とすることでしょう。400G FR4でbreakout設定は奇妙ではあります。
弊社としては短距離で有りスイッチ側はQSFP-DDが利用されることが多いと想定し、片側OSFP-RHS、対向QSFP-DDの両端で異なるモジュールタイプを配線したAOCを評価中です。
(2023/07/06 訂正)
DGX H100はストレージ用として4ポートのQSFPも備えていて、これには二つのCPUそれぞれにConnectX-7が割り当てられています。当初はQSFP-DDであると想定されていましたが出荷されている製品はQSFP112です。QSFP28で100Gbpsとして利用できますが、400Gで利用するにはQSFP112とこれもマイナーなパッケージが必要です。
弊社としてはCY2023Q4を目標にQSFP112 400G DR4の提供準備を進めています。
内部のNVSwitchから出ている18ポートのOSFP。4pathのNVLINKが一つのOSFP。外部NVLink4 switchは2023年3月時点では製品出荷されていない模様。製品型番も未定義。Back-to-Backでの事例も見つけられず。
node数 | 対node接続数 | 外部NVLink SW | 総本数 |
---|---|---|---|
2 | 18 | 0 | 18 |
3 | 9 | 0 | 27 |
4 | 6 | 0 | 36 |
8 | 4 | 5 | 144 |
16 | 2 | 9 | 288 |
32 | 1 | 18 | 576 |
CX7経由のInfiniband又はEthernetポートは個別のH100に接続されていますので、DGX H100間を直接接続してしまうと対向の隣接するH100と通信できません。Infiniband swich経由の接続が必要です。
外部NVLink SWが無い状況ではInfiniBandでnode間接続を行う構成が推奨されている模様。
2x400GのOSFPポートが32ですので、トランシーバー的には800Gで論理的には2x400G接続。800G OSFP AOCがお勧めです。
単独の製品としてConnectX-7搭載のPCIe BUS対応のNICにはOSFP-RHS仕様とQSFP112があります。OSFP-RHSは8 laneですが4 laneの400GAUI-4 C2Mしかサポートしていない可能性が有ります。つまり、配線の半分しか使わない特殊なモジュールが必要です。
PN | port | protocol | |
---|---|---|---|
|
Single OSFP-RHS
|
2x400GAUI-4 C2M
|
DGX H100 interconnet用
|
MCX75310
|
Single OSFP-RHS
|
400GAUI-4 C2M
|
HGX H100用?
|
MCX715105
|
Single QSFP112
|
400GAUI-4 C2M
|
|
MCX715106
|
Dual QSFP112
|
400GAUI-4 C2M
|
DGX H100 storage port用
|
QSFP112
MGX H100
(残念ながら2023年3月現在は弊社からOSFP 400G DR4/FR4及び800G DR8は提供できません)
description | PN | spec | 参考価格 |
---|---|---|---|
800G OSFP-RHS AOC | WS-OR8-AOC | max 30m | TBD |
description | PN | spec | 参考価格 |
---|---|---|---|
400G OSFP-RHS/QSFP-DD AOC | WS-D4O4-AOC | max 50m | ¥350,000 |
400G OSFP-RHS DR4 | WST-OR4-DR4-C | max 500m | Q3CY23 |
400G OSFP-RHS FR4 | WST-OR4-FR4-C | max 2km | Q3CY23 |
800G OSFP-RHS DR8 | WST-OR8-DR8-C | max 500m | Q3CY23 |
800G OSFP-RHS 2xFR4 | WST-OR8-2FR4-C | max 2km | Q4CY23 |
description | PN | spec | 参考価格 |
---|---|---|---|
800G OSFP-RHS/QSFP-DD800 AOC | WS-D8O8-AOC | 30m | Q3CY23 |
800G OSFP-RHS DR8 | WST-OR8-DR8-C | 500m | Q3CY23 |
800G OSFP-RHS 2xFR4 | WST-OR8-2FR4-C | 2km | Q4CY23 |
800G OSFP-RHS FR8 | WST-OR8-FR8-C | 2km | Q1CY24 |
description | PN | spec | 参考価格 |
---|---|---|---|
800G OSFP-RHS DR8 | WST-OR8-DR8-C | 500m | Q3CY23 |
800G OSFP-RHS 2xFR4 | WST-OR8-2FR4-C | 2km | Q4CY23 |
description | PN | spec | 参考価格 |
---|---|---|---|
400G QSFP-DD DR4 | WST-QD4-DR4-C | 500m | ¥314,000 |
400G QSFP-DD FR4 | WST-QD4-FR4-C | 2km | ¥450,000 |
400G QSFP112 DR4 | WST-S112-DR4-C | 500m | Q4CY23 |
800G QSFP-DD800 DR8 | WST-QD8-DR8-C | 500m | Q3CY23 |
800G QSFP-DD800 2xFR4 | WST-QD8-2FR4-C | 2km | Q4CY23 |
800G QSFP-DD800 FR8 | WST-QD8-FR8-C | 2km | Q1CY24 |
400G QSFP112 DR4 | WST-QS4-DR4-C | 500 | Q4CY23 |
400G QSFP112 FR4 | WST-QS4-FR4-C | 2km | Q1CY24 |