WAP手机版 RSS订阅 加入收藏  设为首页
明升m88娱乐
当前位置:首页 > 明升m88娱乐

明升m88娱乐:这是通用人工智能的重要基础工作

时间:2022/9/19 8:23:52   作者:   来源:   阅读:21   评论:0
内容摘要:颜怀志指出:“从本质上讲,‘由图生音’和‘由音生图’仍然是一种基于数据的人工智能,但它更接近人类的理解和思维方式,因此可以认为是一种弱人工智能。”这是通用人工智能的重要基础工作。”实现三模态内容的统一和再现在过去,“象生声”和“声生象”只是幻想,而今天的《子东太初》将这两者变成了现实。“图片产生声音”和“声音产生图片”...
颜怀志指出:“从本质上讲,‘由图生音’和‘由音生图’仍然是一种基于数据的人工智能,但它更接近人类的理解和思维方式,因此可以认为是一种弱人工智能。”这是通用人工智能的重要基础工作。”

实现三模态内容的统一和再现

在过去,“象生声”和“声生象”只是幻想,而今天的《子东太初》将这两者变成了现实。“图片产生声音”和“声音产生图片”是如何实现的?实现图像、明升m88娱乐文字、声音三模态转换的真正关键和内在逻辑是什么?

据报道,《子洞太初》三种模态相互转换生成的核心原理是将视觉、文本和言语的不同模态通过各自的编码器映射到统一的语义空间,然后利用多头自注意机制学习模态。它们之间的语义关联和特征对齐,形成多模态统一的知识表示;然后,利用编码后的多模态特征,通过解码器分别生成文本、图像和语音。

王金桥说:“通俗地说,‘子洞太初’就是把不同形式的三模态内容转化为统一的多模态知识表示,然后用这种知识表示来再生三模态内容。这样,‘图像产生声音’,‘声音产生图像’。”

同时,王金桥也表示,“子洞太初”有四个突破,有效帮助以多模态认知为核心的通用人工智能发展。

具体而言,首先是首次提出了一个多层次、多任务的跨模态自监督学习框架,支持从入口级到模态级和样本级的三层预训练自监督学习方法;模态数据语义的统一表示减少了数据收集和清理的成本;三是首次实现多模态理解和生成任务的统一建模,支持跨模态检索、多模态分类、语音识别、图像生成等理解和生成。四是首次实现无监督超越有监督方法,在5%-10%数据标注的基础上实现100%的监督学习效果。

本类更新

本类推荐

本类排行

本站所有站内信息仅供娱乐参考,不作任何商业用途,不以营利为目的,专注分享快乐,欢迎收藏本站!
所有信息均来自:百度一下 (明升m88官网下载)
苏ICP备08107328号-2