推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

视觉问答与对话系统的新技术进展

北京航空航天大学 副教授

秦曾昌,北京航空航天大学自动化科学与电气工程学院教授,教育部新世纪优秀人才。英国布里斯托(Bristol)大学机器学习与人工智能方向硕士、博士。美国加州大学伯克利分校 (UC Berkeley) 博士后、牛津 (Oxford) 大学与卡内基梅隆大学 (CMU) 访问学者。目前主要研究方向为人工智能、机器学习与数据挖掘、跨媒体检索与自然语言理解。主持过国家自然基金在内的省部级基金10余项,出版英文专著1本、发表包括T-IP, T-Multimedia, Information Fusion, AAAI, IJCAI, MM,CVPR, EMNLP等专业期刊或会议论文近 130余篇。 是我国第一次太空授课专家组成员,也是青少年科技创新大赛、机器人大赛、宋庆龄发明奖等国内外很多青少年科技比赛的评审专家,开展网络科普获得搜狐视频2023年百大播主称号。

秦曾昌,北京航空航天大学自动化科学与电气工程学院教授,教育部新世纪优秀人才。英国布里斯托(Bristol)大学机器学习与人工智能方向硕士、博士。美国加州大学伯克利分校 (UC Berkeley) 博士后、牛津 (Oxford) 大学与卡内基梅隆大学 (CMU) 访问学者。目前主要研究方向为人工智能、机器学习与数据挖掘、跨媒体检索与自然语言理解。主持过国家自然基金在内的省部级基金10余项,出版英文专著1本、发表包括T-IP, T-Multimedia, Information Fusion, AAAI, IJCAI, MM,CVPR, EMNLP等专业期刊或会议论文近 130余篇。 是我国第一次太空授课专家组成员,也是青少年科技创新大赛、机器人大赛、宋庆龄发明奖等国内外很多青少年科技比赛的评审专家,开展网络科普获得搜狐视频2023年百大播主称号。

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

成为教练

课程简介

案例背景:
对于跨模态信息的处理是目前很多推荐、广告、检索等智能系统的核心问题之一,尤其是针对跨模态的问答与对话技术。我们将讨论如何应用深度学习模型对视觉问答系统于视觉对话系统提出新的技术解决方案。

解决思路:
我们将讨论利用多模态信息的融合、图卷积模型来设计相应的对话系统与问答系统。并考虑如何更好的利用知识图谱与先验的关系信息。

成果:
研究成果已经发布了国际同行认可的顶级期刊和会议。期待在实际工业落地的应用。
Jing Yu, Weifeng Zhang, Yuhang Lu, Zengchang Qin, Yue Hu, Jianlong Tan, Qi Wu (2020), Reasoning on the relation: enhancing visual representation for visual question answering and cross-modal retrieval, IEEE Transaction on Multimedia (IF=5.452).
3. Weifeng Zhang, Jing Yu, Hua Hu, Haiyang Hu, Zengchang Qin (2020), Multimodal feature fusion by relational reasoning and attention for visual question answering, Information Fusion (IF=10.716), Vol. 55: pp. 116-126.
Xiaoze Jiang, Jing Yu, Zengchang Qin, Yingying Zhuang, Xingxing Zhang, Yue Hu and Qi Wu (2020), DualVD: An adaptive dual encoding model for deep visual understanding in visual dialogue, Proceedings of National Conference on Artificial Intelligence (AAAI-2020)

目标收益

1 了解视觉问答系统技术的发展与前沿 2 了解最新关于视觉对话的研究工作 3 了解设计智能对话和问答系统的核心算法。

培训对象

课程内容

案例方向


智能语音/NLP/推荐/广告系统实战/计算机视觉

案例背景


对于跨模态信息的处理是目前很多推荐、广告、检索等智能系统的核心问题之一,尤其是针对跨模态的问答与对话技术。我们将讨论如何应用深度学习模型对视觉问答系统于视觉对话系统提出新的技术解决方案。

收益


1 了解视觉问答系统技术的发展与前沿 2 了解最新关于视觉对话的研究工作 3 了解设计智能对话和问答系统的核心算法。

解决思路


我们将讨论利用多模态信息的融合、图卷积模型来设计相应的对话系统与问答系统。并考虑如何更好的利用知识图谱与先验的关系信息。

结果


研究成果已经发布了国际同行认可的顶级期刊和会议。期待在实际工业落地的应用。
Jing Yu, Weifeng Zhang, Yuhang Lu, Zengchang Qin, Yue Hu, Jianlong Tan, Qi Wu (2020), Reasoning on the relation: enhancing visual representation for visual question answering and cross-modal retrieval, IEEE Transaction on Multimedia (IF=5.452).
3. Weifeng Zhang, Jing Yu, Hua Hu, Haiyang Hu, Zengchang Qin (2020), Multimodal feature fusion by relational reasoning and attention for visual question answering, Information Fusion (IF=10.716), Vol. 55: pp. 116-126.
Xiaoze Jiang, Jing Yu, Zengchang Qin, Yingying Zhuang, Xingxing Zhang, Yue Hu and Qi Wu (2020), DualVD: An adaptive dual encoding model for deep visual understanding in visual dialogue, Proceedings of National Conference on Artificial Intelligence (AAAI-2020)

提交需求