王金桥是谁?参加了什么会议活动 – 活动发布 – 活动Q

王金桥是谁?参加了什么会议活动

王金桥
中国科学院自动化研究所模式识别国家重点实验室研究员、博士生导师
中国科学院自动化研究所模式识别国家重点实验室研究员,博士生导师,中国科学院大学人工智能学院岗位教授,华中科技大学兼职教授。现任中国技术创业协会技术创新工作委员会副理事长,国家数字家庭工程技术研究中心技术委员会委员,北京市信息化专家咨询委员会委员,图像图形协会机器视觉专委会委员,中国科学院大学创新创业学院双创导师,中国科学院大学继续教育学院特聘专家,广州市创新团队领军人才,山东省泰山领军人才,主要从事视频分析与检索、大规模目标识别、目标检测与跟踪、图像分类与识别方面的研究。共发表论文280余篇,国际杂志40篇,国际会议220余篇。完成国家标准提案3项,发明专利16项,10项国际视觉算法竞赛冠军,吴文俊人工智能科技进步二等奖,中国发明创新银奖。
关联参加 2022年北京 WOT全球技术创新大会2022·北京站
演讲主题:“紫东太初”千亿参数三模态预训练大模型
随着文本模型GPT3/BERT等提出,预训练模型呈现高速发展的趋势,图像-文本联合学习的双模态模型也不断涌现,显示出在无监督情况下自动学习不同任务和快速迁移到不同领域数据的强大能力。然而,当前的预训练模型忽略了声音信息。我们提出了首个千亿参数图-文-音三模态预训练大模型 “紫东太初”,开拓性的实现了将文本、语音、图像和视频等不同模态的信息映射到统一语义空间,然后通过多头自注意力机制的自监督学习来实现模态之间的语义关联以及特征对齐,形成多模态统一知识表示;既可以实现跨模态理解,还能实现跨模态生成,同时提出了一个基于词条级别、模态级别以及样本级别的多层次、多任务自监督学习统一框架,对更广泛、更多样的下游任务提供模型基础支撑,实现了通过语义网络以图生音、以音生图和视频生成等20多项功能。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注