内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

语音合成定制化成趋势科大讯飞、微软、谷歌

2018-08-24 12:54 出处:未知 人气: 评论(0

  原标题:语音合成定制化成趋势,科大讯飞、微软、谷歌哪家强? 2012年,全球最大语音技术厂商Nuan

  2012年,全球最大语音技术厂商Nuance曾占据62%的全球语音市场。随后,开源语音工具导致语音产业的技术门槛降低,场景为王时代到来,错失机遇的Nuance在智能语音市场步步失守,2015年市场份额已下降到31.6%,被谷歌、苹果、微软、科大讯飞等企业迅速瓜分。

  智能语音2.0时代,场景的重要性不言而喻。谁能赋予声音更多的表现力和个性化,谁就能将技术适配到非标准化的广阔场景中,赢得智能语音市场的未来。科技巨头看到这一趋势,纷纷祭出语音合成“定制化”的大旗。语音合成技术正式进入定制化的2.0时代。

  微软是智能语音行业的领先企业之一。今年5月份的Build 2018 大会上,其在公有云平台上推出了语音合成定制服务产品Custom Voice。将语音和对应文本(500句)上传,Custom Voice即可对声音进行模拟,并在线测试模拟效果。CustomVoice采用全程可视化操作界面,普通用户可快速上手,显示出微软打造定制化、平民化产品的用意。

  无独有偶,近期谷歌人工智能实验室成立的Lyrebird(琴鸟)公司,也推出了自己的定制语音合成系统。同微软的CustomVoice类似,30句英文声音录入后,系统就能在“倾听”中“掌握”每个人说话时字母、音位和单词的发音特点,通过推理并模仿声音中的情感、语调,“说”出全新语句。目前Lyrebird还存在一些缺陷,如合成语音夹杂电流声,中文语句的录入与合成表现都不理想等。

  在国内,唯一能与微软、谷歌同台竞技的就是科大讯飞。去年2017年11月,科大讯飞推出名为“讯飞留声”的测试版本,比微软的CustomVoice还要早半年时间。经过不断优化,讯飞留声制作完整音库只需10句话声音录入,远低于微软采集的500句,亦低于谷歌的30句,语音合成定制化成趋势科大讯飞、微软、谷歌哪家强?采集量只有行业平均的百分之一,合成效果更好。

  “讯飞留声”还以微信小程序(微信搜索“讯飞留声Lite”小程序)的形式呈现,可以实现“即用即走”。不仅声音制作过程更加便捷,用户还能在微信这款中国最大的社交软件上分享制作效果,吸引了大批用户的关注。阿拉丁统计数据显示,小程序上线个月(截至2018年8月8日),讯飞留声访问次数超过51万 ,新用户增长率达到568%,位居阿拉丁“成长最快小程序”周榜第13名。

  科大讯飞语音合成定制业务的快速发展,离不开其雄厚的技术实力支持。2000年之前,中文语音产业由国际IT巨头控制,如微软、IBM等。如今,科大讯飞已彻底扭转中文语音市场几乎全部掌握在国外公司手中的格局,成为亚太地区最大语音和人工智能上市公司。

  科大讯飞不仅中文语音合成效果出色,在国际英文语音合成大赛上也是屡屡得冠。2006年,科大讯飞首次参加国际英文语音合成大赛(Blizzard Challenge),即获得自然度第一的优异成绩,至2018年已连续13年蝉联该项赛事冠军,成为该项赛事中唯一一家自然度超过4分(普通人说话水平)的参赛方。

  在2018国际语音合成大赛的比赛中,科大讯飞摘得10个测评打分项目中的9项第一,成为“最全能的冠军”

  语音合成可以用指定情感表达,但一段文本应该表现出怎样的情感变化,涉及到语义理解和上下文分析。科大讯飞除智能语音技术全球领先外,在自然语言理解上同样属业界翘楚。随着语义和语音的融合交叉发展,科大讯飞或将率先解决语音合成情感表达难。

分享给小伙伴们:
本文标签: 谷歌语音

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。

签名: 验证码: 点击我更换图片

评论列表

    Copyright © 2002-2018 北京pk10走势图 版权所有|黔ICP备16006823号-1