推广 热搜: 索尼  直播  智能手机  全额罚息  奥迪、  小霸王  网约车  新零售  世界杯  短视频 

国产GPU升级万卡集群

   日期:2024-11-26 08:18:38     浏览:0    评论:0    

日前,总部位于北京的国产GPU企业摩尔线程宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡规模。

“AI模型训练的主战场,万卡已成为标配。”摩尔线程创始人兼CEO张建中说。随着计算量不断攀升,大模型训练亟需超级工厂,也就是一个“大且通用”的加速计算平台,从而缩短训练时间,实现模型能力的快速迭代。

所谓万卡集群,是指由一万张及以上的计算加速卡(如GPU)组成的高性能计算系统,用以训练基础大模型。据了解,构建万卡集群并非一万张GPU卡的简单堆叠,而是一项高度复杂的超级系统工程。“可以把万卡集群想象为一个万人团队,团队需要有非常强的沟通机制,才能协同把一件事情做好。”摩尔线程相关负责人说,希望能够建设一个规模超万卡、场景够通用、生态兼容好的加速计算平台,并优先解决大模型训练的难题。

稳定性方面,夸娥万卡集群平均无故障运行时间超过15天,最长可实现大模型稳定训练30天以上,周均训练有效率在99%以上。

 
打赏
免责声明: 本条信息网址: https://www.zhunfafa.com/news/show-66754.html本网站内容来源于网友提供和互联网公开资料等,仅供参考。本网站不对网站所有信息的准确性、可靠性或完整性提供任何保证。若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系,我们将在收到通知后第一时间妥善处理。
 
更多>同类新闻资讯
0相关评论

推荐图文
推荐新闻资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  sitemaps  |  网站地图  |  网站留言  |  违规举报