本日,联念宣告旗下首款 AMD AI 大模子教练任职器联念问天 WA7785a G3 正在单机陈设 671B(满血版) DeepSeek 大模子时,可告竣极限模糊量 6708token / s,将单台任职器运转大模子的本能推向了新高,充满露出了联念正在 AI 本原办法范畴技艺的深奥积淀与研发的急迅反映技能。正在 AI 算力角每日趋白热化的本日,联念再次以硬核技艺势力设置了行业新标杆。
依托联念万全异构智算平台,联念通过访存优化、显存优化、PCIe 5.0 全互联架构改进以及精选 SGLang 框架中本能最优算子等诸多改进体例,对大模子从预教练、后教练到推理的全流程举行接连优化,正在单台陈设 DeepSeek 671B 大模子的联念问天 WA7785a G3 上实测最高模糊量达 6708 token / s。
这一收效意味着单台联念问天 WA7785a G3 可能支持 1500 人周围企业的寻常运用,是继联念问天 WA7780 G3 任职器单机陈设满血版 DeepSeek 大模子总模糊量冲破 2500 token / s 之后,单机陈设该大模子推理本能的又一次冲破。
此次冲破是联念中国本原办法生意群、联念磋议院 ICI 实践室和 AMD 协同计划、协同调优、联合告竣的。此结果也并非最终结果,联念与 AMD 还正在接连测试深度调优新法子。告竣更高调优冲破。
联念问天 WA7785a G3 任职器是联念与 AMD 两边深度合营的灵敏结晶,恰是两边同甘共苦带来的技艺改进、软硬协同技能与架构冲破为 DeepSeek-R1 满血版大模子插上本能起飞的羽翼。
壮大算力引擎:联念问天 WA7785a G3 搭载了 2 颗 AMD 收拾器和 8 颗 AMD 新一代 Instinct OAM GPU,它们为大模子教练、推理等场景供给了壮大的算力引擎。
超大显存上风:WA7785a G3 具有超大的显存容量,单颗 GPU 的 HBM3e 显存容量高达 192GB,合计达 1.5TB。超大显存使得单机救援全量模子推理情景下,仍保存填塞的 KV 缓存空间。而其显存带宽抵达了惊人的 5.3TB/s,GPU 聚集带宽达 896GB/s,节点间汇集带宽 3.2TB/s,更高的带宽可为推体会码告竣极致加快,充满餍足了大模子并行计较时对跨节点通讯的高带宽需求,使其成为用户首选大模子推理任职器。
特有改进架构:联念问天 WA7785a G3 的特别架构计划也为最大水平地开释算力潜能、冲破带宽节造阐扬了闭头效力,其三重独立风道计划辨别针对 CPU 节点、GPU 节点和互换机节点举行精准散热把持,普及了散热作用,为任职器的不乱性和牢靠性供给了有力保险。
另日,联念将接连深化与财产伙伴的技艺合作,通过架构改进、算法优化与硬件技艺改进,连续冲破本能范围,为各行业供给更高密度、更低能耗、更易陈设的 AI 算力本原办法,鞭策 AI 算力向更高效、更普惠、更可接连的目标演进,帮力中国智算财产的接连发达。
告白声明:文内含有的对表跳转链接(征求不限于超链接、二维码、口令等形势),用于传达更多讯息,俭朴甄选时辰,结果仅供参考,IT之家扫数作品均蕴涵本声明。
版权所有 © 2022 尊龙凯时AG·(中国馆)真人平台俱乐部
备案号:苏ICP备20047398号-1
技术支持:化工仪器网
管理登陆
GoogleSitemap