您现在的位置是:首页 > 业界业界
让数字人有灵魂! 阿里巴巴正投入研发“数字人+终端”新形态
cc博主2022-11-07【业界】274人已围观
11月7日消息,阿里巴巴多个团队正联合研发由数字人全面接管的终端交互引擎。预计第一款“数字人+终端”产品将在2023年一季度让用户体验。
项目集合达摩院NLP,语音,视觉,3D构建驱动及大模型领域团队,和天猫精灵AliGenie交互系统专家。就像手指触屏奠定智能手机交互,大模型数字人将接管未来智能交互。2022年开始,达摩院多模态大模型开始应用于天猫精灵语音搜索与百科场景。各方目前将合作场景推向AliGenie交互的系统层和用户感知层。
数字人领域正由喧嚣转向理性。虽然高精度高颜值的人偶形象不断出现,但绝大部分场景缺乏与用户的持续性、个性化互动,进而商业化规模有限。如,只能在短视频和动画中存在的虚拟偶像。或只在单一设备或界面中面向大众支持问答的虚拟员工,这些形态缺乏大模型训练和大规模交互,无法个性化学习升级,用户感受就像“没有灵魂”。
数字人Inside,接管终端——则是阿里巴巴正在尝试的新方式。云栖大会上,阿里巴巴集团研究员李小龙透
露列举了达摩院积累的包括多模态大模型、语音、自然语言、3D构建驱动、各个领域近两年百项专利与顶会论文,通过将这些成果,在诸多交互场景验证,一个多模态大模型为基础的数字人的引擎已初显雏形。
(图:李小龙介绍全新数字人引擎技术架构)
天猫精灵产品规划负责人卢勇介绍,接入AliGenie系统的终端已覆盖4000多万家庭、包含1600多个品牌的4.6亿已接入产品,能让数字人在可持续、大规模、组合式的场景与用户交互。AliGenie此前公布,仅智能音箱产品每月交互80亿次以上,70%是主动型服务。许多消费硬件领域厂商,也迫切希望有超出单出连接、单一设备对话的智能体验。
以多模态大模型驱动的智能化,理论上也非常适合缺乏数据、场景碎片化的智能终端场景。例如,由通义多模态大模型(BroadScope)训练的数字人,可以具备可泛化的认知驱动能力,数字人根据音乐进行舞蹈、根据文字产生行动,改变了过去完全要单一维度数据训练的模式,能够让数字人迁移场景进行服务。
(图:大模型将提升数字人的自主对话能力)
在云语音语义技术方面,Gartner 2022报告显示,阿里综合能力居全球第二。并在Wizard of Wiki(知识对话)、Commonsense QA(常识问答)和VQA(视觉问答)三项全球评测中连续获得冠军,并超过人类能力基准。
以天猫精灵日常对话场景为例,通过大模型底座进一步训练的对话大模型mPLUG-dialog,将可能成为包含知识、情感、个性、记忆的全新交互系统。
在内容上,不再是单纯地按知识库或搜索结构在检索和回答问题,而是综合这四个维度,努力给出更有趣更有情商的回复,在声音上,不再是字正腔圆的播报音,会包含更丰富更细腻的情绪。实时沟通时,AI不仅能被随时打断,也能稳定接茬,还会主动追问。
雷峰网版权文章,未经授权禁止转载。详情见转载须知。
Tags:
相关文章
- 小火箭付费节点在哪里买-小火箭 Shadowrocket 节点购买
- 国内手机翻墙软件推荐(Clash for Android、Clash for iOS 、Shadowrocket 小火箭)
- 翻墙机场是什么意思-机场和VPN有区别吗?
- 挖掘RISC-V金矿,分几步?
- 长期免费ss/ssr节点科技上网-最新v2ray节点链接每日更新(2022/11/5)
- vps+v2Ray教程(3-2):一键安装V2ray(傻瓜脚本小白教程)
- 首款消费级「国潮」显卡进入公开市场,性能追平英伟达六年前入门级
- 江湖再无锐迪科
- 摩斯产品家族全面升级 提供互联互通、软硬结合等一站式服务能力
- Aqara 绿米受邀参加Matter媒体发布会,共推Matter发展
热评文章
2024年V2ray/Clash/SSR/Shadowrocke印度-美国免费节点机场(11/8)
ssr小火箭添加节点地址,小火箭免费节点下载,v2ray小火箭订阅链接更新(2024/11/13)
公益免费Clash节点机场分享,永久v2ray节点梯子每日更新(2024/11/14)
Sim2Real新突破:Jim Fan团队造机器人“修仙”模拟器,挂机50分钟=修炼一整年
“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样
十年后,AMD会超越英伟达吗?
如何给手机挂梯子视频_手机怎么挂梯子上外网 百度经验
telegeram官网入口_纸飞机telegeram官网入口
纪录片电报员传奇_saga传奇纪录片
俄语翻译_俄语翻译在线语音