一、识别“悄悄话”,人工智能语音技术赋能输入法
在AI+输入法的落地上,首先备受关注的就是语音输入,起初,大家一致认为语音输入会更便捷、更受到用户青睐,但恰恰弄巧成拙。不论是否隐私,在中国这个到处都是人的拥挤社会里,适合人们选择语音输入的场合少之又少。百度就是从这里入手,首先解决了即将沦为鸡肋的语音输入痛点,创新推出悄悄话识别功能。
有研究表明,耳语的语音不经声带振动,由此不存在基频,相应的各次谐波也不会产生。因此,耳语的频谱特性不同于正常语音,要想精准识别还要依靠高难度的技术研发,人工智能恰好派上了用场。通过人工智能的主动学习,在基音检测和谐波分析技术的基础上挑选符合耳语特性的数据,百度输入法拥有了专业的“轻声识别”的训练和开发营地。
在识别速度方面,通过标注已有的耳语数据,在声学模型上适配这些训练数据,使现有的声学模型能快速适配耳语语音特性。不得不说,这是语音输入一大开创性成果,也使百度输入法有了颠覆输入法界格局的资本。
二、百度输入法拥有了更高识别准确率
在2017年的博鳌论坛期间,搜狗CEO曾放话称搜狗的语音识别在APP或其他应用场景中都超越了百度,秉承求真务实的精神,网上有网友曝出实测视频。在两部相同手机的聊天、搜索和游戏三个场景下,二者转化速度和准确度差别不大,只是百度输入法的修改次数较低。而在搜索场景中,百度语音识别的正确率更高,识别速度也更快,更加贴合这个快节奏的时代对输入法便捷高效的使用体验要求。
百度的语音识别准确率目前高达97%,超过了正常人的听力水平,语义理解技术支持超56个领域的自定义适配,新一代的深度语音识别系统Deep Speech2更是入选了2016年MIT十大突破性技术。有了人工智能的加持,百度输入法也拥有了更强的识别能力。
三、长文本输入受欢迎,多领域走向领先
今年年初,百度输入法的另一大创新成果——长文本语音输入,在V7.3版本中面世。另有网页应用SwiftScribe在30秒内转换完成了一份时长1分钟的音频文件,其转化效率高出人工速记1.67倍,速记行业转录效率在百度输入法这里得以大幅刷新。
除此之外,百度输入法还率先落地了输入面板上的搜索,并实现了不跳转搜索、单手输入模式等提升使用体验的功能;在输入法与手机通讯录的结合方面,百度也有更具人性化的创新,让语音输入能够识别出通讯录中的人名,继而进行熟识名字的优先转化;在与核心输入相关的领域,位置纠错也是百度独创的核心能力……
四、皮肤加持,熊本熊正版表情也被百度收入囊中
熊本熊有多火,看各大社交、搜索的网络数据就知道,日本的熊本县甚至凭借熊本熊收获了12亿美元经济效益,包括观光和产品销售。百度于16年末拿到熊本熊的授权许可,成为唯一一家拥有熊本熊表情和输入法皮肤的输入法行业授权的公司。
在版权保护以及在内容原创方面的重视态度,也为百度输入法的正面形象大大加分。
搜狗撤诉并不意味着输入法大战结束,新的大战刚刚开始
由此看来,百度输入法在多个领域逐渐展现出的领先优势成为触发百度搜狗输入法专利大战真正的导火索。尤其是在人工智能的加持下,百度输入法取得了行业领先的优势,搜狗的专利撤诉也是意料之中的事情。
百度输入法率先进行技术创新升级、增加语音技术的投入,让搜狗输入法倍感压力,两者之间的战争只会越来越激烈。在市场份额的竞争之后,是基于人工智能技术的大战即将打响。因为,人工智能技术的运用,对于输入法的用户体验起着极为重要的作用,也将会成为这场输入法大战的胜负关键。
在人工智能领域拥有绝对优势的百度,必然将会在这场输入法大战中逐渐占据优势。
笔者认为,一场由人工智能主导的新输入法大战才刚刚打响……
刘旷,以禅道参悟互联网