算力网络人工智能模型推理算力度量研究报告》由中国联通研究院、中讯邮电咨询设计院及联通数字科技有限公司联合发布,聚焦算力网络中AI模型推理算力度量展开研究。2025年AI模型推理成算力需求核心驱动力,搜索AI化、智能体爆发、多模态内容生成及大模型推理普及使推理算力需求激增,如豆包token消耗量2025年达16万亿,较2024年增长约160倍。算力网络作为新型基础设施,整合云 - 边 - 端算力资源,其架构含服务提供层、服务编排层等模块,能灵活调配资源满足不同推理任务需求,为模型推理提供算力支撑。报告明确算力网络AI模型推理算力度量概念,即量化评估推理任务算力资源需求,为模型部署等提供依据,构建“算力消耗量”与“算力使用量”双维度度量模型,前者通过业务、节点、资源三层级架构实现业务与资源映射,后者聚焦用户需求量化算力使用。还建立多维度指标体系,涵盖模型参数、计算量、处理速度等指标,并介绍模型剖析、推理并行、基本操作数测量等关键技术。结合ResNet50、DeepSeek R1模型及联通云计量计费案例验证度量方法有效性,联通云将AI推理服务封装成云产品,提供按量计费与Token资源包两种模式,未来需进一步完善算力度量技术,推动算力网络与AI深度融合。