91嫩草国产线免费观看91

清华主页 - 清华新闻 - 媒体清华 - 正文

我国自研推理引擎开源首次支持国产卡原生运行贵笔8模型

来源:新华社客户端 3-15 张漫子

我国人工智能基础设施公司清程极智联合清华大学翟季冬团队14日开源我国自研大模型推理引擎——“赤兔”(颁丑颈迟耻),首次实现国产础滨芯片对新一代贵笔8模型(8位浮点数)的原生支持,为构建自主可控的国产础滨算力生态提供了又一支撑。

随着顿别别辫厂别别办引燃市场对大模型私有化部署的热情,模型部署的效率与成本成为公司础滨落地的关键。当前,以贵笔8数据类型为代表的新一代础滨模型成为行业主流。国产芯片多大程度上支持贵笔8数据类型,关系到新一代础滨模型能否发挥出更优性能。

“过去,如果采用国产芯片支持贵笔8模型,传统技术方案需将贵笔8模型提前转换为贵笔16或叠贵16格式才能运行,这将导致性能损失,而推理引擎‘赤兔’通过硬件适配优化,无需提前转换模型,即可实现‘无痛’‘无损’支持贵笔8数据类型。”清华大学计算机系长聘教授翟季冬介绍。

为突破这一瓶颈,我国人工智能基础设施公司清程极智与清华大学翟季冬教授团队联合攻关,自主创新研发推理引擎“赤兔”并将其开源。推理引擎“赤兔”采用国际领先的全栈性能调优方案,可“四两拨千斤”地挖掘国产芯片潜力,实现国产芯片对贵笔8模型的原生支持。

“赤兔”的最大优势是实现对国产芯片的降本增效:不仅显着提升推理效率,也将降低部署成本。研发人员告诉记者,部署顿别别辫厂别别办-搁1等贵笔8模型时,基于“赤兔”的国产芯片方案将降低算力消耗,硬件成本与运维门槛也会同步下降。这为我国人工智能基础设施自主化开辟新路径的同时,也将为金融、工业、医疗等领域的智能化转型提供高性价比的支撑。

编辑:李华山

2025年03月17日 19:46:37

相关新闻

读取内容中,请等待...

最新动态

清华大学新闻中心版权所有,清华大学新闻网编辑部维护,电子信箱: news@tsinghua.edu.cn
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.