【科技号】9月20日,还有不到十天,万众期待的国庆十一长假就要来了。赶在这之前,百度地 图推出一项“黑科技”功能:只需要录制20句话、最快20分钟,就可以生成一个私人定制的语音包。
百度地图事业部总经理李莹
这个语音包不仅能在地图导航时在你耳边响起,还能在百度地图的景区智能语音导览、智能语音交互、导航等全部场景使用。无论是与小度助手的交互,还是景点的介绍播报,都可以使用用户自行录制的语音包。是不是很酷,很想动手DIY呢。现在,我们就手把手的带你做。
只需4步 20分钟制作定制语音包
第一步:下载最新版百度地图V19.0 APP,目前iOS和安卓版均已上线该功能。
第二步:点开百度地图APP-出行助手-语音定制
第三步:开始录制
现在百度地图提供4种角色的声音选择,女声、男声、童声女、童声男,可以按你自己喜好选。
选定好角色,再选好要读的语音文本,就可以开始录制了。
我们选择了男声、女童音分别录制。
操作超级简单:对着手机话筒,按顺序依次读出句子,读完20句就可以点击“完成”,提交给百度地图后台去制作你自己的语音包了。
录制过程中,如果读句子缓慢、太大声等,百度地图会提示你重新录制。
整体而言,录制过程还是非常轻松易过的。我们在测试时,读完20句话也就花了不到5分钟。
第四步:生成定制语音包。下载后,可使用、分享。
录制完成的语音包音频可以自定义名称和封面。
我们是20点38分完成录制,20点51分左右语音包就已经制作完成,耗时不到20分钟。
语音包除了可应用在自己的手机百度地图上,还可以分享给朋友使用,微信、朋友圈和微博都是分享途径。也可以发布到百度地图,让所有地图用户可见可用。
同时,对于用户非常关心的音频数据安全问题,百度地图也表示,百度地图对于语音定制服务的权限获取将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。用户可以完全安心使用。
制作过程总结:简单易上手、省时省力、普通用户完成操作无压力。
语音包与真人声音相似度:真心觉的挺高的。我们分别测试了成人和童声,整体感觉成人语音包和真实声音的相似度,比童声的要更好一些。
使用简单的一小步,背后是技术进步的一大步
到这里,我们不禁想探究是什么让百度地图语音定制功能如此易操作呢?
百度语音首席架构师贾磊道出了百度地图语音定制功能背后的“秘密”,他介绍,百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,这让个性化语音合成的定制门槛大大降低。
百度语音首席架构师贾磊
事实上,依托百度人工智能技术,百度地图一直在努力深化百度语音技术与地图场景的融合应用。
早在2017年,依托百度大脑强大的语音能力与自然语言理解能力,百度地图已实现了全场景下的语音全局操控,彻底为用户解放双手,将繁琐的点触交互转变为自然流畅的语音交互。2018年百度AI开发者大会曾现场演示一段长达60多字的服务请求:“我要从三里屯的团结湖地铁站出发路过望京的家乐福然后再去南锣鼓巷最后到我家,我要红绿灯少的不堵车的最快的路线,你帮我路线规划一下吧”,百度地图语音助手100%正确识别,并自然流畅地提供了导航服务。
在百度地图语音交互方面,依托百度大脑语音领域多项领先技术,百度地图可以在各个场景下完成语音的准确唤醒和精准识别,做到“听清、听懂、满足”用户需求。例如驾车环境中,地图甚至可以比人耳听得更加清楚。另外,通过识别复杂的语句,根据百度在自然语言处理和知识图谱两个方向做的多年的积累,可以使语音助手与人的交互更加口语化,更加自然。
同时,百度地图“小度助手” 通过用户画像、深度学习等能力,还能给每个用户带来个性化信息和服务推荐,更好满足用户各类真实诉求。正因为百度地图语音助手的“无所不能”,截止目前,百度地图智能语音助手用户数已累计突破2.5亿。
百度地图事业部总经理李莹曾表示,地图是AI最典型的落地场景,AI技术让地图更智能、更懂用户需求。同时,用户使用地图的数据也将反哺AI技术,推动AI的进一步发展,让AI时代的福利惠及每个人。
再回来看这次百度地图推出的语音定制功能,无疑是又一次将语音技术与百度地图完美融合,并以超低门槛的普惠给所有用户,让每个人都能感受到AI技术进步给生活带来的改变。
一点感想:过去,制作这类地图语音包对于普通人来说可能是“不可想象”的事情,它需要专业录音棚、大量语料、长达数月的制作,可谓流程复杂、耗时长,往往是专业的科技团队才能胜任的工作。
现在,人工智能语音技术能力发展日新月异,使用门槛越来越低,以百度地图20句话、20分钟就能定制语音包为例,人工智能技术已经实实在在走进了人们的日常生活中。
AI扑面而来,你准备好使用了吗?