大模型太“吃算力”?HiFloat给出低位宽计算新解法
2026-05-14
以下文章来源于微信公众号——全球计算联盟GCC
GCC NEWS
随着 AI 大模型对算力、内存带宽和能效提出更高要求,低位宽数据格式凭借其在计算效率、存储开销和能耗控制等方面的显著优势,正成为提升大模型训练与推理效率的关键技术方向。巴黎时间5月5日至6日,全球计算联盟(GCC)白金会员华为技术有限公司在全球开源创新汇GOSIM Paris 2026上,展示了其自研的HiFloat系列低位宽数据格式,分享该技术在大模型训练与推理中的实践成果。目前,GCC-HiFloat社区已启动首季面向模型验证的“HiFloat大模型共创行动”,推动低位宽计算从技术探索走向规模化应用。

GOSIM Paris 2026是面向全球开源开发者、研究人员、技术企业和产业生态伙伴的国际开源技术交流活动。大会聚焦开源AI、智能体、边缘智能、AI硬件、开源模型等前沿方向,汇聚Google、Intel、NVIDIA、Arm、Huawei、ByteDance等全球技术企业、开源项目和科研机构参与。HiFloat系列低位宽数据格式在这一国际开源舞台亮相,体现了低位宽计算在大模型高能效训练与推理场景中的重要价值,也为全球开发者和产业伙伴参与低位宽数据格式生态建设提供了新的交流窗口。
面向大模型高能效计算的低位宽数据格式
随着大模型参数规模、训练数据和推理需求的持续增长,AI计算正在面临更高的算力、显存、能耗和成本压力。如何在尽可能保持模型效果和训练稳定性的同时,降低计算资源消耗,已经成为AI基础设施领域的重要技术方向。
HiFloat是智算时代面向大模型高能效计算设计的低位宽浮点数据格式,重点面向8比特及以下的低位宽计算场景。通俗来说,HiFloat希望用更少的数据位宽完成更高效的AI计算,在保障模型精度和稳定性的基础上,降低训练与推理过程中的显存占用、算力开销和能耗成本。
HiFloat8:简化大模型训练,提升效率与稳定性面对大模型日益增长的算力与显存需求,HiFloat8作为一种创新的8位浮点格式,旨在解决现有低位宽方案在训练中存在的不稳定、流程复杂等痛点。它通过创新的设计,实现了训练和推理的统一,无需复杂的缩放策略,即可达到接近高精度格式的训练稳定性,同时显著提升训练效率。

从技术研讨到国际挑战赛
持续推进模型验证与工程实践
目前HiFloat系列已在从经典模型到千亿级大模型的多类场景中完成验证,在相关验证场景中展现出良好的精度保持、能效提升和成本优化潜力。与此同时,华为下一代昇腾AI芯片将原生支持HiFloat系列格式,为低位宽数据格式在AI 训练、推理和工程部署中的规模化应用提供进一步支撑。
在即将收官的IEEE ICME 2026 Grand Challenge中,GCC作为主办方组织了聚焦低位宽量化的技术挑战,已收获来自海内外超过15家企业、高校和科研院所的验证成果。相关成果将于今年7月在泰国曼谷举办的专题Workshop中进一步交流展示。

面向未来,GCC将以HiFloat社区为开放协作入口,持续推进低位宽数据格式在标准开放、模型验证、工程实践和产业应用中的协同创新。GCC-HiFloat社区已经启动第一期面向模型验证的“HiFloat大模型共创行动”,广泛邀请产业界开发者、模型团队、AI框架与工具链伙伴、科研机构共同参与,围绕真实模型与工程场景开展验证共建,推动低位宽计算从技术探索走向规模化应用。

扫码查看活动详情

https://www.gccorg.com/article/50/18.html
如希望进一步了解HiFloat低位宽计算相关工作,或参与GCC-HiFloat社区后续技术研讨、标准共建、产业联创及生态合作活动,欢迎联系:
GCC-HiFloat社区
gcc_hifloat@gccorg.com
