迄今最复杂人工智能语音模型创建|天天看点
2023-06-26 13:20:33 来源:科技日报
(资料图片)
Meta称研制出迄今最复杂人工智能语音模型。图片来源:英国《每日邮报》网站
科技日报北京6月25日电(记者刘霞)据英国《每日邮报》23日报道,脸书母公司元宇宙平台公司(Meta)称,其已研制出“迄今功能最强大的语音生成式人工智能Voicebox”,它能够模仿任何人的声音,包括逝者。不过,由于担心这项先进技术会被滥用,Meta宣布不会公开其人工智能模型。
Meta公司深度学习人工智能研究人员在介绍Voicebox时指出,Voicebox使用了“流匹配”方法,其表现优于当前最先进生成式语音系统使用的扩散模型。结果显示,Voicebox生成的人工音频更容易理解,单词错误率为1.9%,低于竞争对手的5.9%。此外,Voicebox生成的音频与真人的相似性更高,同时速度快了近20倍。
在跨语言翻译时,Voicebox的表现优于备受赞誉的多语言文本—语音AIYourTS,单词平均错误率从10.9%降低到5.2%,音频相似度从0.335提高到0.481。
Meta阐述了Voicebox的多种用途,称其可用来帮助视障人士听到朋友和亲人的信息,或允许非母语人士用自己的声音翻译自己所说的话。据悉,Voicebox目前能说6种语言:英语、法语、西班牙语、德语、波兰语和葡萄牙语。
不过,Meta强调称,由于潜在的滥用风险,他们目前不会公开Voicebox模型及其代码。虽然他们认为向人工智能社区开放并分享研究,对于推动人工智能向前迈进非常重要,但在开放与责任之间取得正确的平衡也至关重要。
【总编辑圈点】
ChatGPT横空出世半年多时间,人们已然深刻感受到人工智能语言模型的强大。对于各种提问,它都能对答如流,令人惊叹。试想一下,如果人工智能在回答人类的提问时,不仅内容形式酷似真人,就连声音也令人真假难辨,用户恐怕会感受到更强的冲击力。而后者,正是语音生成式人工智能要实现的目标。不过,正如文中所言,这些强大的技术确实有被滥用的可能,在人工智能技术不断升级迭代的同时,相关监管与伦理约束也要及时“上路”。
关键词:
推荐内容
- 迄今最复杂人工智能语音模型创建|天天看点
- 重庆的酸菜鸡怎么做才好吃
- 端午“趣”方特 自贡“方特史前冰纷季”拉开帷幕
- 安徽固镇:暖心托举孩子未来_速递
- 天天微头条丨民生直通车|热浪来袭,透视北方多地
- 郑州公共住宅建投补充中票注册文件 说明募集资金
- 产品经理必备的专业术语
- 阿里刚换帅 京东忙换将:胡伟出任京东物流CEO
- 曾庆化(关于曾庆化介绍)
- “女友”要自杀?男子报警后发现美女竟是抠脚汉…
- 大型项目中的建成,都离不开混凝土外加剂 天天快
- 作家笔下的喀什 | 马璞:帕米尔高原旅行记-当前热文
- 官方 : 西悉尼流浪者免签珀斯光荣后卫科利斯比_
- “短板”变“潜力板” 广东推动协调发展_当前热闻
- 现场直击!海南公开销毁毒品248公斤|今日热讯
- 台媒曝周杰伦为8岁爱女择澳洲贵族女校,昆凌疑似
- iPhone拍照什么水平?DXO排名第八,拍照比较真实
- 2023年高校毕业生等青年就业服务攻坚行动启动_天
- 全球百事通!中央民族乐团年度原创民族音乐会《颂
- “茅五泸汾洋”纷纷下挫,食品ETF(515710)跌超2
- 【环球热闻】热化了!A股这一板块逆势暴涨!“高
- 世界看点:精选!《真人快打1》仍然保留惩罚怒退
- 杀疯了 乐天派桌面机器人1799元震撼上市
- 《龙珠Z:卡卡罗特》第五弹DLC截图展示悟空对战场景
- 广西持续强降雨导致供电受影响 65万用户已恢复用
- 天天关注:新舞台展现退役军人硬核实力,湖北乡村
- 全球热点!远见城市中心价值,抢占广州东部中心新
- 世界微动态丨广东公布高考分数线:本科历史433分
- 广西河池抽水蓄能电站预可研审查会议召开
- 再登顶刊!《Nature》发表南大拓扑物理研究最新评
- 全球看点:广州考古发现商时期文化遗存 体现中原
- 探访海口美兰国际机场封关运作项目:将实现旅客“
- 陕西从严惩处毒品犯罪 提升禁毒综治效能
- 微宏科技亮相广东省500强及上市公司CIO大会
- 世界滚动:20寸行李箱尺寸对照表图片_20寸行李箱尺
- 全球视点!震撼!《熟年》大结局:重大疑云揭开,
- 全球通讯!医学伦理课,究竟是什么大型吃瓜现场啊
- 透水混凝土价格多少钱一平方_透水混凝土价格多少|
- 铁建重工隧道装备再获两项殊荣 环球信息
- 南华医院关节外科成功为高龄老人进行微创全髋关节