尊龙凯时:ad称沉模块数字称沉模

2025-05-19

　　本日，联念宣告旗下首款 AMD AI 大模子教练任职器联念问天 WA7785a G3 正在单机陈设 671B（满血版） DeepSeek 大模子时，可告竣极限模糊量 6708token / s，将单台任职器运转大模子的本能推向了新高，充满露出了联念正在 AI 本原办法范畴技艺的深奥积淀与研发的急迅反映技能。正在 AI 算力角每日趋白热化的本日，联念再次以硬核技艺势力设置了行业新标杆。

　　依托联念万全异构智算平台，联念通过访存优化、显存优化、PCIe 5.0 全互联架构改进以及精选 SGLang 框架中本能最优算子等诸多改进体例，对大模子从预教练、后教练到推理的全流程举行接连优化，正在单台陈设 DeepSeek 671B 大模子的联念问天 WA7785a G3 上实测最高模糊量达 6708 token / s。

　　这一收效意味着单台联念问天 WA7785a G3 可能支持 1500 人周围企业的寻常运用，是继联念问天 WA7780 G3 任职器单机陈设满血版 DeepSeek 大模子总模糊量冲破 2500 token / s 之后，单机陈设该大模子推理本能的又一次冲破。

　　此次冲破是联念中国本原办法生意群、联念磋议院 ICI 实践室和 AMD 协同计划、协同调优、联合告竣的。此结果也并非最终结果，联念与 AMD 还正在接连测试深度调优新法子。告竣更高调优冲破。

　　联念问天 WA7785a G3 任职器是联念与 AMD 两边深度合营的灵敏结晶，恰是两边同甘共苦带来的技艺改进、软硬协同技能与架构冲破为 DeepSeek-R1 满血版大模子插上本能起飞的羽翼。

　　壮大算力引擎：联念问天 WA7785a G3 搭载了 2 颗 AMD 收拾器和 8 颗 AMD 新一代 Instinct OAM GPU，它们为大模子教练、推理等场景供给了壮大的算力引擎。

　　超大显存上风：WA7785a G3 具有超大的显存容量，单颗 GPU 的 HBM3e 显存容量高达 192GB，合计达 1.5TB。超大显存使得单机救援全量模子推理情景下，仍保存填塞的 KV 缓存空间。而其显存带宽抵达了惊人的 5.3TB/s，GPU 聚集带宽达 896GB/s，节点间汇集带宽 3.2TB/s，更高的带宽可为推体会码告竣极致加快，充满餍足了大模子并行计较时对跨节点通讯的高带宽需求，使其成为用户首选大模子推理任职器。

　　特有改进架构：联念问天 WA7785a G3 的特别架构计划也为最大水平地开释算力潜能、冲破带宽节造阐扬了闭头效力，其三重独立风道计划辨别针对 CPU 节点、GPU 节点和互换机节点举行精准散热把持，普及了散热作用，为任职器的不乱性和牢靠性供给了有力保险。

　　另日，联念将接连深化与财产伙伴的技艺合作，通过架构改进、算法优化与硬件技艺改进，连续冲破本能范围，为各行业供给更高密度、更低能耗、更易陈设的 AI 算力本原办法，鞭策 AI 算力向更高效、更普惠、更可接连的目标演进，帮力中国智算财产的接连发达。

　　告白声明：文内含有的对表跳转链接（征求不限于超链接、二维码、口令等形势），用于传达更多讯息，俭朴甄选时辰，结果仅供参考，IT之家扫数作品均蕴涵本声明。

下一篇：称沉模块么称沉模块十大品牌国产称沉模块