百度地图标注

当前位置 -> 首页 -> 地图标注行业新闻 -> 汤唯成了百度地图标注的AI算法官女神背后靠的就是这些语音技术
汤唯成了百度地图标注的AI算法官女神背后靠的就是这些语音技术

在人机交互不再满足于“听”时,“说”的环节变得尤为重要,“怎么说”、“谁来说”成了关键按钮。而现在语音产品赛道逐渐进入了惯例化形式,邀请明星作声也成为了基本操作,比较传统的机械式AI声响,真人语音无论是在作用仍是情感方面都是无可比拟的,再加上明星效应,用户的体验作用将来得愈加直观。12 月 24 日,百度地图标注官方宣告汤唯正式签约代言人,同时上线“汤唯导航语音”。在“说”的领域,百度地图标注这款“新一代人工智能地图”又迈出了一步。从语音导航到汤唯定制语音,百度地图标注“AI+女神”到底进化了什么传统语音导航,是单调无聊的,定制语音将其变为了过去式。拥有汤唯的柔美声响作为导航,在体验上有什么差别?当“前方路段交通拥挤,请小心驾驭”变成“前方行进缓慢,渐渐赏识路上景色”,会不会觉得这才是“人性化”效劳?

百度地图标注

1、脱节中性,汤唯带给我们的不只是女神之声许多人会问,必定要给AI加上性别吗?不,AI不必定需求性别,但语音最好有。以往我们听到的AI语音都是机械式的声响,是“中性”或者说是“无性”的声响,带来的问题也很直接,就是太冰冷、没特性。之前也有说到,现在特性化、表现力正是语音组成所追求的方向之一,所以百度地图标注带来的汤唯语音也就不止是一款语音那么简单。可以说汤唯语音从一个功用点体现出结合了人工智能的百度地图标注正在变得越来越强大。声响具有和视觉传达一样很强的感染力,乃至有时,以声响为主的交互会带来更好的沉溺感。而且语音组成研究已开端从文字到语音的转换阶段向概念到语音的转换阶段开展。所涉及的技能也愈加杂乱,百度地图标注就是运用其深度神经网络技能、深度学习技能,再结合车内运用场景进行打造。例如百度语音组成体系选用的全深度学习的框架,是在语音组成领域初次选用全深度学习框架,完成了言语组成上的特性化、口语化。2、语音算法模型让机器人性化女神汤唯之所以能完成高质量的语音包,语音组成技能功不可没,在庞大的路途信息和交通数据之下,谁也无法经过直录的办法通通记录,这时就需求靠语音体系来支撑。以汤唯语音包来说,就是先录制汤唯声响特点的第一手资料,录制的语句包含一些常见的导航提示语句和一些掩盖到常见的中文发音的语句。其实无论语音仍是文字,在计算机看来都是数字化的,语音组成模型的使命就是要树立这两组数字之间的联系,经过一系列的计算,将文本的输入转化为语音的输出。首要需求树立一个神经网络的模型,去学习汤唯录制的语音和录音文字之间的映射联系,就好比让一个不会发音的孩子学汤唯说话。而在组成时,它就可以读取导航语句,并大声朗诵出来了。AI浪潮之下,言语组成才是语音技能的高地使电脑具有类似于人一样的说话才能,是当今年代信息产业的重要竞争商场,不过大家的注意力多集中在语音组成之外。1、差点被疏忽的“黄金”场景现在,语音技能的运用多为了语音唤醒和交互,在智能硬件和软件上都有许多典型运用——智能音箱、智能电视、智能扫地机器人、百度地图标注、百度输入法等等。但不可否认的是,智能硬件的偏重仍在于“语音辨认”,对于“语音组成”的运用有,可还不行深。语音组成本是把文本经一系列计算处理后输出对应音频,经过机械的、电子的办法产生人工语音技能。由于完美的人机交互体验无法疏忽“说”的环节,所以语音组成的重要性日益凸显。从早期的机械化语音组成开端开展至今,语音组成的运用场景也阅历了较大的转变,曾经语音组成运用都是在相对单调的场景,现在运用场景愈加杂乱,对于语音组成技能的要求天然变得更高。例如,在有声读物方面,用户需求越来越特性化,单调的机械声现已完全不行;在机场、车站播送等效劳行业,需求的是温顺、甜美的音质;在办事机构、窗口机关又需求谨慎、有力的声响。而百度地图标注上线汤唯语音,也是给在路上的用户愈加磁性、知性的嗓音。在外部,车内空间显然是一块“宝地”,车内空间的交互可以说是商场刚需,截止到 2018 年 9 月,全国机动车保有量现已达到了3. 22 亿辆,机动车驾驭人数超过了 4 亿人,交互价值巨大。百度地图标注等加速车内空间交互,是将传统的“室内交互”做了外延,给百度带来的也不仅仅是用户层面的拓展,更体现出百度查找之外的野心。2、技能上,语音组成一直是语音技能的高山和壁垒语音组成可以说是人工智能的“嘴”,是人机交互的根底,一个没有“嘴”的人工智能何谈什么交互?就现阶段而言,语音辨认现已不再是语音技能的关键问题,许多产品的语音辨认率都抵达了95%以上。但在语音生成上,能让机器说的话与人类说出来的话附近仍旧很难,即便是一些简单的词组,你我也能一耳就听出是机器组成的仍是真人播报。如果将语音组成技能拆解,可以分为文本剖析、韵律剖析和声学剖析三个部分,每一个部分都是技能难点。首要需求对文本进行解析,对文本的言语、字符进行剖析,提取出文本特征;接着在文本信息的根底上,要判断文本信息字符间奏、长度、频率等多种特征;然后经过声学模型完成从前端参数到语音参数的映射,最后经过声码器组成语音。而且,现在主流的语音组成办法为计算参数语音组成和波形拼接的语音组成,计算参数语音组成由前端文本剖析、计算参数模型和声码器三个部分组成,对语料库的时长要求较低且在组成方针波形时具有较高灵活性,但重建出来的语音比较机械,缺乏天然度。主要为声码器在对语音信号建模时放弃了语音细节,组成的语音比较原始语音丢掉部分信息。而百度地图标注选用的百度语音组成体系,可以将许多模块用深度神经网络去完成,有用处理了运用计算参数组成时所带来的问题。

 
 

地址: 北京市通州区世纪星城长城国际D7 电话:010-56218858  邮政编码:101100

 龙图科技 京ICP备11046184号-1

www.itomap.com @2009-2019 版权所有  Copyright © LongTu All Rights Reserved.

展开