当前位置：首页 > 新闻资讯 > 人工智能 > 多模态问答的方法和挑战

多模态问答的方法和挑战

来源：青源会编辑：九游集团品牌时间：2022/10/14 主题：其他 [加盟]

多模态检索成为近期关注的问题，当前的方法包括单流方法、多流方法，以及不同模态之间对齐的技术，已经在知识挖掘领域开展应用。

图像问答可以分为三个层次:

1.初级:从图像识别啲结果中直接得到答案

2.中等：答案需要简单事实的支持

3.高级:对于复杂的问题，答案不在图像中，可能涉及常识、具体话题和百科知识进行推理

多模态问答的挑战：

1 多模态数据具有异构性

2 多模态数据的关联难度表示较大

3 多模态知识融合困难

4 多模态问答大多只能处理简单的问题

5 多模态知识问答推理能力弱

6 多模态知识问答可解释性差

视觉大模型拥有18亿参数 30亿的标注图像进行训练

谷歌CVPR 2022拥有18亿参数,并使用30亿的标注图像进行训练,在ImageNet上取得了新的记录90.45%,证明了视觉大模型（30亿参数）在广泛视觉问题上的有效性

任意文本到图像生成模型 DALLE模型 Imagen模型

OpenAI提出DALLE模型,可以根据用户输入的文本生成对应的图像,Imagen模型,CogView,VQ-Diffusion 模型以及 NUWA-infinity 等效果同样出色

2022人工智能时代的算法治理报告-构建法律、伦理、技术协同的算法治理格局

告立足于算法的技术趋势和行业应用现状,从法律监管,伦理治理,技术治理三个层面梳理总结国内外在算法治理方面的实践做法,保障算法技术创新与应用健康

《2022年中国人工智能医学影像产业研究报告》基层篇

受基层影像医师学历偏低和经验不足等因素影响,基层影像设备诊疗能力并未被完全释放,为人工智能医学影像产品在基层落地提供巨大市场机遇

中国银行业协会团体技术报告《人工智能模型风险管理框架》

第一级银行业金融机构未在任何业务建立模型分级方法/流程;第二级银行业金融机构从业务和技术层面;第三级银行业金融机构明确模型分级原则方法和操作要求

我国新一代人工智能治理工作框架是什么样的

我国新一代人工智能治理工作框架应整合社会各界对AI社会技术复合体的离散性认知,突破AI包容审慎实践的探索,建立基于“逻辑-秩序-监管“的人工智能治理工作框架

2022人工智能产业市场规模和发展特点

高增长:未来五年全球人工智能市场规模平均增速将超过20%;高集中:软件占比近40%硬件产品占比接近35%;高壁垒:渗透率还不到4%

人工智能产品不同阶段(规划设计,研发部署,运营使用)的风险挑战

在规划设计阶段机器学习场景中固有的不可预测性,传达实施偏差会进一步加剧;在研发部署阶段模型运行之后的动态更新缺乏足够验证等挑战

人工智能安全技术体系包括提升技术安全和构建技术管理机制

构建面向可持续发展的人工智能技术体系,推动人工智能技术可用、可靠、可信，其内涵包括提升技术安全和构建技术管理机制两个层面工作

可持续发展人工智能治理框架：协同共治治理实践企业面向可持续发展的人工智能体系

企业作为落实人工智能治理原则的重要主体,形成覆盖人工智能产品全生命周期的风险管理机制,提出了面向可持续发展的人工智能治理基本框架

三大人工智能的风险初步探析

数据不完备和滥用风险突出而损害用户的权益;人工智能算法存在固有缺陷在可解释性鲁棒性偏见歧视等方面尚存在局限;企业人工智能管理体系不完善

六大人工智能的热点问题

调度决策外卖调度系统困住骑手;个性化推荐电商场景下的信息茧房和马太效应;内容治理如何守护清朗健康的网络环境;人工智能可以放心使用吗

上海数字大脑研究院发布《2022上半年度人工智能行业报告》

全球人工智能市场收支规模达850厅美元,预测,2022年该市场规模将同比增长约20%至 1017厅美元,并将于2025年突破2000厅美元大关, CAGR 达24.5%

人工智能关键词:可信落地

头部科技企业先后发布了AI治理战略和治理体系,成立了相关委员会和工作组,聚焦企业层面的AI治理和风险管理体系,可信AI技术和保障工具也在蓬勃发展

人工智能关键词:企业智能

智能文档处理、智能会议、知识管理、智能客服等各类企业智能应用不断发展，全面赋能企业办公、管理、决策、风控、营销、服务等各个环节

人工智能关键词:人工智能新基建

AI软件设施在近两年成为产业焦点,AI开源框架生态,预训练大模型体系,AI软件平台生态等内容都得到了长足的发展,像水电一样成为触手可得的普惠资源

人工智能关键词:MLOps

到端的MLOps一体化工具和细分场景的专项工具都非常火热,端到端工具追求大而全的功能集,专项工具在局部或某些场景下功能和性能较好

多模态问答的方法和挑战

图像问答可以分为三个层次:

多模态问答的挑战：

服务机器人(迎宾、讲解、导诊...)