现在,有了百度地图的语音定制功能,人人都可以是“大明星”。
定制专属语音包的流程十分简单,只需打开百度地图App,唤醒“小度小度”后说“录制我的语音”,或点击百度地图首页的“出行助手”后进入“语音定制”,便可开启语音定制之旅。在安静的环境中,只要跟着百度地图的指引,念出卡通和影视台词等充满趣味性的录制文本,等待20分钟左右,就能拥有一个自己专属的语音包,并在百度地图的景区智能语音导览、智能语音交互、导航等全部场景使用。
有了百度地图的语音定制功能后,用户不仅可以使用自己或家人的语音包畅游景区听播报,还可以将录制的个人语音包还可以分享给亲朋好友,无论是思念游子的父母、还是异地的恋人都能通过地图语音包与亲人更“近”一步。这种亲近感,极大提升了地图软件的使用体验,也是用户普遍都希望在地图软件上看到的新特征。
百度地图“语音定制功能”的发布,标志着地图导航进入“语音定制”时代。
二、MEITRON模型技术:百度地图“语音定制”实现的关键
从技术角度看,要实现这种极受欢迎的语音定制,地图软件的制作技术必须要跨越三大门槛:灵活的音色转换、朗读的多情感化、语音的韵律迁移。而目前能够跨越这些技术障碍的,只有百度一家。
据了解,百度为实现语音定制,在AI技术领域独创了风格迁移技术Meitron模型。该模型能够以按照不同的情感模式来合成语音;并能够根据一个人的声音特征,合成出不同的讲话风格;甚至能够依靠少量的样本语音,来合成符合一个人讲话特征的专属音库。为了展示Meitron模型的高超能力,百度在今年5月还通过语音合成技术,利用少量的录音材料,专门为某位抗战老兵“再造”了栩栩如生的讲话声音,让他的老战友们能在时空中与其“重逢”。
再现“奇迹”的Meitron模型技术,实际上是一种端到端建模的注意力模型。这种模型具有语言语音一体化建模的优势,能够大幅提升语音识别率,并能高效率地实现在嵌入式场合的语音应用。目前,这种注意力模型是语音识别与合成行业里,各大巨头纷纷投入大量资源进行研发的重点。但是除了百度外,其他公司都还没能在主流产品上广泛应用这种技术。在全球同行业中,百度首家实现了在全线产品中都统一采用基于注意力机制的端到端语音识别建模。
Meitron模型的实际应用,以及用户语音定制功能的推出,标志着百度不但在工业级别上实现了对基于注意力机制的端到端语音识别建模的大规模应用,而且将这种技术普及到了“民用层面”,对产品使用体验的提升,具有重大意义。
三、产异化竞争时代,百度地图“语音定制”更有温度
在百度这种新功能推出之前,市面上的地图产品在语音应用方面,基本都处于差不多的水平上:普通用户要么只能使用单调的男、女音来制作语音包,要么就只能被动接受厂商推送的所谓“明星导航语音包”。在这方面,整个行业都呈现出同质竞争的状况。百度的语音定制功能上线后,行业状况发生了根本改变,从此进入差异化竞争时代。
百度地图的声音服务,不但表达更加精准,而且合成效果更加逼真、丰富,让用户真正体验到人性化的智能服务,和温暖的情感。在百度带动下,好地图的标准已经大幅提升:用户会要求地图软件提供声音更加清晰、情感更加自然,多场景、多角色的声音服务。
显然,精确、智能化、人性化、有温度的百度地图语音定制功能,无形中已经成为地图软件的新标准,是否具备这样的功能,也就成为用户判断该地图软件“好”与“不好”的依据了。
通过对语音定制功能的完善,百度抓住了地图软件领域里的用户需求痛点:消费者不但要求地图软件提供精准的定位和可靠的导航,更需要软件在旅途中,能够给他们带来亲切的、个性化的、有温度的使用体验。
具备了语音定制功能的百度地图,也就拥有了先进技术 + 情感体验的双重优势。当用户在日常使用过程中,能够听到自己想要的、熟悉的声音时,以往冷冰冰的地图软件,瞬间就变成了用户“专属”的旅途伴侣。这种“只属于我”的情感体验,将使百度地图的用户粘性空前提升。
这种温暖的使用体验,也会令用户不再愿意转换到其他软件产品中去,百度地图也更具差异化竞争优势。