首页
产品系列
行业应用
渠道合作
新闻中心
研究院
投资者关系
技术支持
关于九游集团品牌
| En
 
  当前位置:首页 > 新闻资讯 > 机器人开发 > 让大规模深度学习训练线性加速、性能无损,基于BMUF的Adam优化器并行化实践  
 

让大规模深度学习训练线性加速、性能无损,基于BMUF的Adam优化器并行化实践

来源:AI科技大本营      编辑:九游集团品牌      时间:2020/5/29      主题:其他   [加盟]

作为一种自适应步长随机梯度优化器,自2014年提出以来,Adam 算法便以其卓越的性能风靡深度学习领域。为了提高应用于训练大规模任务时的效率,该算法通常与同步随机梯度(Synchronous Stochastic Gradient,SSG)技术相结合,采用数据并行(data parallel)的方式在多台机器上执行。在本文中,我们称这一方法为 Sync-Adam。

本质上来讲,Sync-Adam 通过将一个 minibatch 内样本的梯度计算分布到多台机器上达到加速目的,因此通信十分频繁,并且随着并行机器数目增多,minibatch 内样本的数量也成比例增加,这种情况下,通常会损害最终得到的模型的性能。为解决基于 SSG 的 Adam 算法可扩展性差的难题,我们把目光投向了逐区块模型更新滤波(Blockwise Model-Update Filtering, BMUF)框架。

BMUF 是一种通信高效的通用分布式优化算法框架,于2016年由微软亚洲研究院语音组的研究人员提出并发表。该算法在多个并行工作机之间周期性同步模型更新信息,并与历史更新信息相结合提升全局模型性能。与基于 SSG 的算法相比,BMUF 具有通信频率较低、训练几乎线性加速、模型性能基本无损的特点。这一算法已经在工业界广泛用于大规模深度学习模型的训练。

本文中,我们采用 BMUF 框架并行化 Adam 算法,并在微软大规模 OCR 和语音产品数据集上进行了测试。实验结果表明,在大规模 OCR 任务中,BMUF-Adam 在多达64机的并行训练中几乎实现了线性加速的同时,基本没有模型性能损失,在32机大词汇量连续语音识别任务中也获得了类似效果。

接下来我们探讨如何采用 BMUF 框架赋能 Adam 算法,在大规模深度学习任务上成就不凡。


在基于 BMUF 的训练框架下,假设我们总共有 N 个并行工作机,一个工作机可以是一块或多块 GPU 卡,也可以是一个计算节点。给定一个包含 Nτ 个 minibatch 的训练数据子集,首先我们将这些数据均匀分布到 N 个并行工作机,每台工作机获得 τ 个 minibatch。从一个共同的初始模型 θ_(t-τ)^((init)) 开始,N 个工作机独立更新各自的局部模型 τ 步,得到 {θ_(t,1),θ_(t,2),…,θ_(t,N)},对局部模型取平均得到 θ ̅_t。这一过程称之为数据块内并行优化(Intra-Block Parallel Optimization, IBPO)。与直接将 θ ̅_t 作为全局模型不同,BMUF 技术将历史更新信息与当前更新信息结合,得到全局模型:






音乐人工智能、计算机听觉及音乐科技

音乐科技、音乐人工智能与计算机听觉以数字音乐和声音为研究对象,是声学、心理学、信号处理、人工智能、多媒体、音乐学及各行业领域知识相结合的重要交叉学科,具有重要的学术研究和产业开发价值

【深度】未来5-10年计算机视觉发展趋势为何?

专家(查红彬,陈熙霖,卢湖川,刘烨斌,章国锋)从计算机视觉发展历程、现有研究局限性、未来研究方向以及视觉研究范式等多方面展开了深入的探讨

华南理工大学罗晶博士和杨辰光教授团队发文提出遥操作机器人交互感知与学习算法

罗晶博士和杨辰光教授团队提出,遥操作机器人系统可以自然地与外界环境进行交互、编码人机协作任务和生成任务模型,从而提升系统的类人化操作行为和智能化程度

实时识别卡扣成功装配的机器学习框架

卡扣式装配广泛应用于多种产品类型的制造中,卡扣装配是结构性的锁定机制,通过一个机器学习框架将人类识别成功快速装配的能力迁移到自主机器人装配上。

基于多任务学习和负反馈的深度召回模型

基于行为序列的深度学习推荐模型搭配高性能的近似检索算法可以实现既准又快的召回性能,如何利用这些丰富的反馈信息改进召回模型的性能

张帆博士与Yiannis Demiris教授团队提出高效的机器人学习抓取衣服方法

机器人辅助穿衣通常人工的将衣服附在机器人末端执行器上,忽略机器人识别衣服抓取点并进行抓取的过程,从而将问题简化

百度算法大牛35页PPT讲解基于EasyDL训练并部署企业级高精度AI模型

百度AI开发平台高级研发工程师饼干老师,为大家系统讲解企业在AI模型开发中的难点,以及针对这些难点,百度EasyDL专业版又是如何解决的

Technica公司发布智能雾计算平台技术白皮书

SmartFog可以轻松地将人工智能分析微服务部署到云、雾和物联网设备上,其架构支持与现有系统的灵活集成,提供了大量的实现方案,要用下一代人工智能算法来弥补现有解决方案的不足。

深度学习在术前手术规划中的应用

深度学习对推动术前手术规划尤其重要,手术规划中要根据现有的医疗记录来计划手术程序,而成像对于手术的成功至关重要
 
资料获取
新闻资讯
== 资讯 ==
» 人形机器人未来3-5年能够实现产业化的方
» 导诊服务机器人上岗门诊大厅 助力医院智慧
» 山东省青岛市政府办公厅发布《数字青岛20
» 关于印发《青海省支持大数据产业发展政策措
» 全屋无主灯智能化规范
» 微波雷达传感技术室内照明应用规范
» 人工智能研发运营体系(ML0ps)实践指
» 四驱四转移动机器人运动模型及应用分析
» 国内细分赛道企业在 AIGC 各应用场景
» 国内科技大厂布局生成式 AI,未来有望借
» AIGC领域相关初创公司及业务场景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 图片渗透率,视频 直播
» AI商业化空间前景广阔应用场景丰富
» AI 内容创作成本大幅降低且耗时更短 优
 
== 机器人推荐 ==
 
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

 

                              消毒机器人排名                导览机器人         
版权所有 © 九游集团品牌智能机器人集团股份有限公司     中国运营中心:北京·清华科技园九号楼5层     中国生产中心:山东日照太原路71号
销售1:4006-935-088    销售2:4006-937-088   客服电话: 4008-128-728