当前位置：首页 > 新闻资讯 > 人工智能 > 大模型的异构计算和加速:加速方法,包括XPU异构计算,多个模型的精度,推理算法优化

大模型的异构计算和加速:加速方法,包括XPU异构计算,多个模型的精度,推理算法优化

来源：戴金权编辑：九游集团品牌时间：2024/11/29 主题：其他 [加盟]

《大模型专题：大模型的异构计算和加速》由英特尔院士戴金权在AiCon全球人工智能开发与应用大会上的演讲内容整理而成。报告介绍了大语言模型的异构计算和加速相关技术。首先阐述大语言模型基于Transformer解码器架构的自回归模型原理。接着分析大模型推理和训练面临的瓶颈，包括内存带宽、计算、显存大小和分布式计算等方面。

报告重点介绍了大模型的异构计算和加速方法。包括XPU异构计算，涉及CPU、GPU、NPU等硬件加速；低比特计算，如模型量化/压缩、数据类型选择、低比特算子应用以及对显存使用量和训练微调的影响，并对比了不同量化方式下多个模型的精度；还介绍了推理算法优化，涵盖Self - speculative decoding、KV Cache compression等多种方式。

此外，报告还介绍了IPEX - LLM开源大模型XPU加速框架及其应用场景，如在Intel Core Ultra AI PC、Intel Arc A770 GPU等不同硬件上的加速体验，包括Office助手、工业机器人代码生成、AI座舱 - 汽车助理等多个应用案例展示了英特尔XPU在大模型应用创新方面的成果，并鼓励关注和试用IPEX - LLM，在Intel XPU平台开发大模型及其应用。

附件：大模型的异构计算和加速:加速方法,包括XPU异构计算,多个模型的精度,推理算法优化

大模型的异构计算和加速:加速方法,包括XPU异构计算,多个模型的精度,推理算法优化

人人都必须为2025年的十大人工智能趋势做好准备

AI大模型落户矿山，智能化形成商业闭环，井下智能综采面远程控制

第一到第五范式:经验范式理论范式计算范式驱动范式

AI 的五大悖论-可解释性与自主性悖论

AI 的三大谬误-AI无所不能,将取代人类

人工智能+引爆新质生产力革命,AI技术在不同领域的应用变革

AI应用专题：百花齐放，静待杀手级应用

2024人工智能大模型的技术岗位与能力培养研究报告-中国软件行业协会

2024生成商业新未来，AI+营销是目前落地最快的场景

如何利用AI提升工作效率和收入：2024年GenAI人工智能和工作的未来

智能设计革命：大模型时代如何颠覆设计行业，引领未来创新潮流

AI结合电商、广告应用发展飞速！AI+教育暂处最底位！2023中国人工智能产业应用发展图谱

服务机器人(迎宾、讲解、导诊...)