S5000 - WWW.AWTEY.CN - WWW.AWTEY.CN

摩尔线程 × 中国移动：国产 GPU 支撑央企大模型，S5000 完成九天 35B 适配

www.ithome.com · 2026-04-28 08:38:51+08:00 · tech

IT之家 4 月 28 日消息，中国移动自主研发的九天 35B 通用大模型将在第九届数字中国建设峰会上正式发布。摩尔线程官方昨晚宣布，其基于旗舰级 AI 训推一体全功能 GPU MTT S5000，依托成熟的 MUSA 软件栈与高性能算子优化，已率先完成九天 35B 模型的全流程适配与推理验证。据介绍，本次适配中，摩尔线程基于自研 MUSA 软件栈与 SGLang-MUSA 高性能推理引擎，深度打通九天 35B 模型推理全链路。 MTT S5000 基于第四代 MUSA“平湖”架构打造，单卡 AI 稠密算力可达 1000 TFLOPS ，支持从 FP8 到 FP64 全精度计算，匹配九天 35B 大模型在长文本处理与高并发响应方面的核心需求。摩尔线程通过 MUSA C 开发框架、muDNN 计算库与 MATE 开源算子库的全栈优化，针对九天 35B 模型特有的注意力机制与长序列推理进行深度适配，确保模型在 MTT S5000 上高效执行。在标准推理场景下，MTT S5000 可稳定支撑九天 35B 模型的高并发请求。 IT之家注：MTT S5000 是专为大模型训练、推理及高性能计算而设计的全功能 GPU 智算卡，基于第四代 MUSA 架构“平湖”打造。其单卡 AI 算力最高可达 1000 TFLOPS，配备 80GB 显存，显存带宽达到 1.6TB/s，卡间互联带宽为 784GB/s，完整支持从 FP8 到 FP64 的全精度计算。

摩尔线程携手智源 FlagOS，为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配

www.ithome.com · 2026-04-24 17:24:48+08:00 · tech

IT之家 4 月 24 日消息，摩尔线程今天携手智源 FlagOS，为旗舰级 AI 训推一体全功能 GPU MTT S5000 完成 DeepSeek-V4-Flash 模型 Day-0 适配。据介绍，DeepSeek-V4-Flash 模型采用混合专家（MoE）架构，总参数量达 284B，激活参数 13B，支持百万 token（词元）上下文长度。预训练数据超 32Ttoken，在最大推理力度模式（Flash-Max）下推理能力逼近 Pro 版本。值得注意的是，DeepSeek-V4 模型首次采用了“FP4+FP8”混合精度策略，而国内当前主流 AI 芯片仍普遍以 BF16 为主。摩尔线程凭借原生 FP8 支持能力，可更高效承载 DeepSeek-V4 的前沿精度设计。同时，MTT S5000 GPU 内置硬件级 FP8 Tensor Core 加速单元，相比传统 BF16/FP16 能将数据位宽直接减半，显存带宽压力降低 50%，理论计算吞吐量实现翻倍。为充分发挥 MTT S5000 的 FP8 优势，FlagOS 团队为 DeepSeek-V4 模型进行 FP8 量化。通过系统级分析，双方技术团队将本次适配的攻坚重点锁定在 FP8 算子与 Sparse Attention 算子，在“编译优化”与“自动调优”两大方向取得重大突破。综合IT之家此前报道，摩尔线程已多次 Day-0 即时适配国产大模型，涵盖 MiniMax M2.7 、智谱 GLM-5 等

摩尔线程完成 MiniMax M2.7 大模型 Day-0 适配，支持 MTT S5000 训推一体全功能 GPU

www.ithome.com · 2026-04-12 22:50:29+08:00 · tech

IT之家 4 月 12 日消息，摩尔线程已完成 MiniMax M2.7 大模型 Day-0 适配，支持 MTT S5000 旗舰级 AI 训推一体全功能 GPU。据介绍， MiniMax M2.7 是业界首个具备深度自我进化能力的大模型，能够自主构建 Agent Harness，通过 Agent Teams 协作、复杂 Skills 调用及 Tool Search Tool 等能力完成复杂生产力任务，甚至深度参与自身迭代。值得注意的是，摩尔线程已多次 Day-0 即时适配国产大模型，涵盖智谱 GLM-5、千问 QwQ-32B 等。 IT之家注：MTT S5000 是专为大模型训练、推理及高性能计算而设计的全功能 GPU 智算卡，基于第四代 MUSA 架构“平湖”打造。其单卡 AI 算力最高可达 1000 TFLOPS，配备 80GB 显存，显存带宽达到 1.6TB/s，卡间互联带宽为 784GB/s，完整支持从 FP8 到 FP64 的全精度计算。

/tag/S5000