讯飞星火首发多情感超拟人合成,科大讯飞如何让智能语音更进一步

锐丰小天才 外汇基金 2024-05-04 85785

智能语音助手如今已经几乎随处可见。人们的手机上,智能音箱上,新能源汽车里,到处都是各种各样的语音助手。它们和人类对话,解决人们生活中各种各样的需求。

作为人工智能国家队,4 月 26 日,科大讯飞对外发布了讯飞星火 V3.5 更新版本,新增加了多情感超拟人合成语音功能,将全自然语音交互体验再度升级,拟人度达到了83%。

同时,讯飞星火的情绪感知能力也再度提升,情绪表达的可感知度达到 85% 以上,对高兴、抱歉、安慰、撒娇、困惑等语气表达更加生动,可以满足用户在各种场景下的自我减压、释放情绪等需求。

现在讯飞星火的超拟人对话已经变得更加智能。科大讯飞董事长刘庆峰介绍,“它可以完全像真人一样有各种各样的感情,有生动的口语表达,还可以有笑声,有语气有情调等等这些。”

比如当你伤心或者难过时,就可以直接给讯飞星火“打电话”――它们甚至专门做了一个形似电话沟通的界面――仿佛就是在和一个知心老友倾诉心事。高兴时,它会和你一起欢呼雀跃;难过时,它会默默倾听,细心安慰。

过去的语音助手只停留在单纯的语音控制上,只能够帮助用户完成一些既定的任务动作,而无法满足更深层次的陪伴功能。讯飞星火在大模型能力的加持下,真正将语音助手升级成了智能情感伙伴。

想象一下,当你在为工作烦心时,讯飞星火可以感知到你情绪的细微变化,比如当你说“心情有些差时”,它的语调也变得也变得平缓起来,但又带着一些朋友关心的急迫,“哎呀,听到你心情不好我也很难过,如果你愿意和我聊聊的话,我很愿意倾听。记住,无论发生什么我都会在这里陪着你哦。”

当你向她分享自己取得了一些进步时,它也变得高兴起来,“你要为自己感到骄傲和开心!”还会主动问你有没有一些庆祝的计划。

讯飞星火 V3.5 更新版本的进步不止于此,在声音复刻上更是实现了一句话复刻的重磅更新。

技术提升的背后是科大讯飞多年来在语音合成上的不断求索。刘庆峰介绍,当年他们做林志玲的语音,需要到中国台湾录一个礼拜的声音。后来模仿郭德纲,只需要录制一天。再往后一小时、5 分钟,现在终于实现了一句话复刻的突破。

刘庆峰说,很多用户都向他们提出过需求,比如能不能模仿孩子的声音给家里的老人读书读报?能不能模仿在家长出差时,模仿家长的声音给孩子讲故事。现在需求都可以得到满足。打开讯飞星火 APP,只需要朗读一句话就可以复刻出专属于自己音色的语音助手,声音的拟真程度几乎以假乱真。

一句话复刻声音在 C 端场景更多的是提升语音助手的陪伴能力。面对幼儿、老人等需要家庭成员关怀的群体,一句话声音复刻可以实现仿佛家庭成员般对话的亲切感。

北京师范大学此前发布的一份针对老年人情感关怀的报告中提到,中老年人的孤独感普遍存在,他们苦于在生活里遇到困难或者遭遇人生变故时无人述说,需要填充生活中的空白。

讯飞星火此次更新的多情感超拟人合成语音,或许会为解决老年人的心理孤独发挥出独特作用,让科技更有温度。

行业调研机构德勤 Deloitte 发布的《未来的语音世界-中国智能语音市场分析》报告中指出,我国智能语音市场行业规模预计在 2030 年达到 1452 亿元。德勤指出,随着新兴自然语言技术产生以及已有技术的不断成熟,智能语音技术已经从萌芽期迈入了成熟期,推动大规模的商业化应用落地。

毫无疑问,超拟人语音的加入将会为智慧金融、智慧医疗、智慧教育以及运营商语音等行业市场带来巨变,智能语音开始真正从消费级场景迈向更广阔的专业应用场景,拥有巨大的行业想象空间。作为国内一直以来的人工智能国家队,科大讯飞或将在大模型时代继续引领语音行业变革。


版权声明

本文仅代表作者观点,不代表平台立场。
本文系作者授权平台发表,未经许可,不得转载。