🏷️ 万亿参数

← 返回首页

从KB到TB：我在256块B200上调度万亿参数训练的30天——每步延迟都刻进骨头里

2026年6月19日 12 次浏览

我叫周明远，干了六年嵌入式AI，在Cortex‑M7上剪枝量化、在Jetson Nano上死磕YOLO的每一KB共享内存。去年公司接了个大模型预训练的活，我直接被扔进一堆B200里——从4MB SRAM直接跳到192GB HBM3e，从单芯片功耗3W跳到每卡1000W，跨度大到让我前两周连电源线都不…