![]() |
类Siri应用火热:百度搜狗抢夺语音助手市场 |
2012年12月10日
【
转载
】腾讯科技 编辑:
浏览次数:
|
本文标签:Siri 百度 搜狗 |
目前阶段正属于从互联网时代向移动互联网时候转移的 时代,消费者还没有 构成语音查找的 使用习惯 。 实现这一转变可能还需要至少2年 工夫 。

语音查找时代开始到来!国外Siri、Google Now大行其道,消费者正 感想一个特殊时代 。Siri将iPhone变成一个智能化机器人,利用Siri可通过手机读短信、了解餐厅、询问天气、语音设置闹钟 。Google Now则通过智能化读取 要害词后,为消费者提供 有关的语音服务 。
国内Siri、Google Now 遭逢重重困扰,却给众多企业布局移动互联网机会 。中移动通过入股科大讯飞,并联手科大讯飞推出智能语音门户产品,构建自己的Siri 妄想 。 遭逢移动互联网冲击的百度、搜狗们也在 踊跃筹划,通过语音帮手类产品构建在PC端的优势 。
今年在百度媒体开放日上,百度负责人 泄漏,语音查找作为移动查找的主要查找产品之一,百度将在年底推 类似于语音帮手产品 。搜狗更是在今年11月底推出可 利用于iOS与安卓系统平台的语音帮手产品, 宣告成为国内首家涉足移动智能语音助理服务领域的查找厂商 。
搜狗查找事业部总经理茹立云对腾讯科技 泄漏,搜狗早在今年3月份就对搜狗语音帮手 名目立项,到如今搜狗语音帮手 名目已成立了百人团队,目前已有100万的安装量, 盼望半年内搜狗语音帮手有上万以上的安装 。
查找厂商涉足语音查找仅仅是 工夫问题
Siri 的横空 出生激发一场语音热点, 构建在语音交互 根底上的个人智能助理产品也代表着日后移动产品的进展趋向 。早有业内专家指出,一款具备良好体验的的语音助理类工具首先需要 壮大语言 了解 威力,其次也需要长 工夫 构造化数据积存和索引技术的 支撑 。
茹立云指出,查找引擎厂商具备比Siri 威力更强主要是在3个方面:1, 自 本领机语音 鉴别和 用意 鉴别,搜素引擎做了多年;2,查找引擎有众多开放平台数据, 比方天气预报、航班、美食数据都 可以接入进来,问答数据也 可以接入进来,Siri的问答数据则需要手动补充;3,大的查找引擎厂商都有自己的 常识图谱系统,能做精准化演算,Siri则有局限性 。
实际上,为 抗衡Siri,谷歌推出Google Now,其先天优势在于与Google查找 性能 联合,智能化读取 要害词后,提供的信息 有关性更高,而且 几乎是 霎时返 答复案 。而Siri通常在消费者提出问题后,要等几秒钟才会得到答案,甚至Siri需要在网上查找后给出答案 。
因此,查找厂商涉足语音查找领域仅仅是 工夫问题 。谷歌在华的不作为则给百度、搜狗机会 。目前百度、搜狗正在这一领域构建优势 。
搜狗 占有自主研发的服务器集群及抓取技术,输入法有本土中文语言模型和基于云端技术的互联网词库,能 普及中文分词及长句输入精确率 。不过,与百度 径自研发不同, 只管搜狗有语音搜素技术,而且已在搜狗输入法上 使用,搜狗语音帮手还是 取舍的是第三方 。
茹立云介绍,语音帮手立项之初,搜狗语音技术处于立项阶段 。搜狗曾对国内语音提供商测评和接触,对象包含百度讯飞、隆重语音、云之声和科大讯飞,最后 取舍云之声为合作 搭档 。
“云之声对我们 支撑到位, 动机不错, 将来搜狗语音帮手和云之声还将 深刻合作 。”茹立云指出,搜狗 本身的语音技术也在独立往前走 。
语音帮手将会有众多 扩大 性能
据了解,语音查找从诞生到现在, 使用人群还 绝对精英化 。此外,中国是一个人口众多的国家,不惟独众多方言,还面临不少人说一般话不 标准的 挑战,这些都是语音查找面临的问题 。
茹立云指出,语音查找的 动机并非那样的差强人意,通过对消费者语音查找后的实际数据 综合,语音查找 鉴别 威力在85%以上,尤其是中国北方 鉴别率显而易见比南方高众多,假如依旧出现语音查找 舛误,消费者可通过手动 修改 。
将来语音查找大规模展开时,可通过不同地区声波进行 鉴别 。一些大众方言 比方上海话、广东话,语音 鉴别技术也 根本能像一般话一样解决掉, 惟独消费者规模达到 定然程度 。“固然, 将来众多 使用语音查找消费者可能也不太会手动输入,语音查找的技术方面也得 普及 。”
茹立云认为,消费者正属于从互联网时代向移动互联网时候转移的 时代,还没有 构成语音查找 使用习惯, 实现这一转变可能还需要至少2年 工夫 。
固然,语音查找服务 状态也会 产生众多转变和 扩大, 比方语音帮手会有众多周边 利用 。以搜狗语音帮手为例,其将 支撑号码百事通,里面有3000多万的内置的电话号码 。搜狗也会推出SNS产品与搜狗语音帮手想通 。
关于目前的搜狗语音帮手来说,最大 使命是跑马圈地的 扩充消费者量 。茹立云 泄漏说,搜狗在和众多厂商接触,会在明年1月份公布一批 策略合作的 搭档,并适当做一些预装 。
茹立云说:“现在语音帮手是手机很主要的一个亮点,众多厂商都会打出 类似牌子吸 援消费者, 经营商也会和一些软件进行合作 。 将来搜狗会做一个开放平台,厂商在阅读器或特定 利用里可直接把我们后端技术接入进去,通过搜狗语音帮手就 可以做 获得这种智能查找和 答复体验 。”
固然,着力于语音操纵的苹果对语音软件并不太 友爱 。讯飞语点申请上架 工夫远超苹果AppStore7-10天的审核周期 。国外一款类Siri产品Evi也 遭逢 类似 难堪 。苹果曾公开 示意,已有苹果产品或者广告主题外观 类似 混同的 利用程序将会被 回绝 。
对此,茹立云也无奈 示意,还没看多国内一款类Siri产品 顺利上线,谷歌也是将Google Now变成Google语音查找才上线 。目前,搜狗语音帮手以Android版本为主,iOS版也在做,不过,搜狗也正跟苹果沟通 怎么能让搜狗语音帮手上架 。
以下是专访搜狗查找事业部总经理茹立云实录:
腾讯科技:搜狗近日公布智能语音助理软件“搜狗语音帮手”,成为国内第一家涉足移动智能语音助理服务领域的查找厂商 。 是不是介绍一下当初为什么要做这个 名目?
茹立云:之前我们也向来在探究移动互联网时代的查找 状态是什么样的,自从siri公布后,我们觉得siri 相符手机平台 将来查找的 状态,由于siri能很好的利用手机 特点并将手机上 使用查找的不便捷性在 定然程度上解决:手机屏幕 比较小、输入不便捷,通过语音 模式 可以很好的解决输入不便捷的问题,同时查找 后果或返回的 后果更精准,不像PC上你要一个个去 取舍 。
所以我们认为siri代表了 将来移动上查找的解决 方案,但现在处于一个初期阶段,离真正成熟还有相当一段 工夫需要去 奋力 。
腾讯科技: 是不是介绍一下国外像siri这样的语音 利用是 怎么的现状?语音查找作为移动查找的主要查找产品之一,百度也会在年底推 类似语音帮手的产品 。 是不是又介绍一下国内现状?
茹立云:上一年iPhone 4S上推出siri 利用,我们看到了语音成为手机上有用的交互 模式的可能,而不像以往不得不通过输入文字来进行 抒发,siri更好地利用手机 性能,由于手机 本身是跟语音打交道 。其次是更多地把手机 本身操纵智能性通过语音 模式满足 。
再次是后续服务上,siri除手机操纵,还 可以跟它智能聊天,智能的猎取更进一步的 后果, 比方说当地生活服务,或更深 品位的 常识计算 有关的 后果,现阶段大家晓得像Google的 常识图谱,搜狗的知立方,在这之前Wolfram alpha 也是一个 常识计算引擎,而且是 常识计算引擎里面 绝对来讲做得 比较早的 。苹果把它引入到了siri里面 。
在这之后谷歌推出了Google Now,两者的主要差异在于siri基于问答式的 模式而google还是以传统查找 模式为主 。
之后国内一些厂商也在尝试,但这些厂商缺乏自主的语音 鉴别技术,缺乏语义 了解上的积存和后续的服务 威力 。 比方国外有这种开放的成熟 常识计算引擎,国内还没有 。直到现在搜狗推出语音帮手,查找引擎厂商具备的 威力会比之前苹果的 威力更强 。
腾讯科技:您提到 常识图谱,Google推的 常识图谱和Google Now,和苹果siri区别在哪里?
茹立云:Google的 常识图谱跟siri用的Wolfram|Alpha引擎有 比较大的差异,目前Google的 常识图谱更多的是在 比较抢手的领域,突出 常识中间的关联, 比方说一个明星 可以得到他全部演过的电影和唱过的歌中间的关联 。而Wolfram|Alpha更多的是依据这种 常识的关系做更进一步复杂的计算 。 比方说它有中国GDP每年的数字,你问它中国一年GDP的增进率,它就 可以自动地计算出来,而且生成一个报表,所以这是 常识图谱和siri方面的差异 。
现在Google更多地把PC上的图谱接到Google Now的一套引擎里 。从我的 了解来讲, 将来像 常识图谱这种 利用在 构建关系的 根底上,更主要的是 可以做更进一步复杂的计算 。它 可以给你提供解决 方案,不只仅给你一堆原始的数据 。
所以 常识图谱是把原来 比较复杂、 比较 混乱的数据通过机器 开掘组织起来,变成 比较清楚的关系的数据,进一步的计算我认为 将来会产生更大价格 。这也正是搜狗在做的十分主要的工作 。
腾讯科技:百度在尝试 类似的实物查找,搜狗可能比百度做得更早,大家做实物查找是为了语音查找更顺畅展开?
茹立云:首先在PC上有 比较大的实物查找方面的需要,之前这方面的需要 比较多的是通过问答 模式来解决 。但问答会受 工夫的 制约, 比方说是一个 工夫性需要,就会受 工夫 制约;地区性的需要,就会受到地区 制约;还有它 本身的逻辑性、推理性和延展性都 比较差 。
由于假如问答里面问的是一个问题,再略微 扩大丝毫它就解决不了 。之前我们举过一个例子,梁启超太太的儿子的情人可能问答里有,但问梁启超太太的儿子的情人的爸爸是谁?那问答里面没有,它就解决不了 。通过更近一步的 常识图谱或者是知立方或者是 常识关系,首先 可以把这些 常识关系计算在一同,同时它 可以在这后面做众多推理的 事件 。在关系上计算,假如你 如许复杂,我都能帮你推理出来 。在PC上它就 可以 补偿原来数据上的缺乏 。
进一步到移动互联网,由于手机界面 本身更小,对查找的 后果或 答复的 后果要求性更高,那么你通过 常识图谱这种 模式就 可以更好地给你提供精准的答案,而且 可以把整个推理过程都告诉你 。便是更 合适移动时代查找的需要 。
腾讯科技:无论是Google 常识图谱还是国内的实物查找, 广泛面临的问题是国内各种词句十分 丰硕,既有深度又有广度,怎么 均衡这些问题,为语音查找来服务呢?
茹立云: 本身数据的构建是个逐渐的过程,现在无论是Google还是搜狗,还是百度现在 遮蔽的类别都有限,大家主要是在做人物类、地理位 相信息 有关,还有动植物,或者是作家 有关的东西,然而 将来这个会越来越多,由于 本身的信息就互联网上,我怎么把它 开掘出来 。所以第一个是数据的规模尽可能地 遮蔽消费者可能 遮蔽的领域 。
第二个是有了这些 根底数据后,怎么样让消费者 查问和数据 可以匹配上,而且 可以让这些数据进行 有关推理和演算,其实主要是这几个方面 。第一个是自然语言 解决技术和积存 。 比方古汉语、现代汉语博大 精湛,悲剧和杯具是同音词,我怎么把它 开掘出来 构成允许关系,我 可以在词的 根底上 构建一种网络, 可以把 雷同上下义衍生出来,这是一个自然语言 解决上的 根本功 。
在这个 根底上需要做 查问 用意的 了解,怎么把一个自然语言 查问转化成后续的 常识库 可以推理的 查问 。它可能是一对一,也可能是一对多的计算,这个需要做众多的 根底的工作和 深刻的探究 。 本身这方面已经有了 比较多的尝试了,像原来的开放平台的
计算,在做的便是这方面的工作 。
第三块在原有 常识库上, 本身推理 模式的计算,其实是整个系统里面最难的,也是现在人工智能这个领域还没有 彻底解决的,需要做众多的工作 。
腾讯科技:查找引擎有天然因素去做移动语音查找 。但在移动互联网时代,移动查找排名也仅仅是在前十位置,位置还次于地图 利用,那么语音查找到底会给移动查找带来什么样的转变?
茹立云:查找 利用在手机上可能没有PC那么主要,这 本身跟移动的 特点 有关 。首先手机输入很不容易,其次移动上会有大量的APP存在,这是跟PC上不一样的,找这些APP对应于PC上找相应的网站或 利用 。
但有了语音之后,找APP就不用一页页地翻了,对它一说就能找到了 。这就像PC上的导航查找一样, 比方现在上某一个网站,消费者会从查找引擎查找 有关网站名称 而后再过去这个过程在查找引擎里称为导航性查找 用意的查找,便是找 用意明确的网站 。在手机上,用语音呼出 利用其实也是一个查找的过程 。现在搜狗的语音帮手 支撑这方面的 性能,而且众多人会用 。
其次在手机上,通过阅读器去查找的过程很 吃力,需要 打开阅读器,再找到查找框,再在查找框里输入想要查找的内容, 而后再在返回 后果中找到想要的信息,每个过程在手机上都是高成本的 。而假如通过语音查找的 模式, 惟独一拿出来一 谈话,精准的 后果即将就出现出来,而且 后果是事先通过大量复杂计算得到的,猎取 后果的成本会大幅减低 。从而 可以 晋升消费者 使用的便捷性和频度 。现在有数据显示,在PC查找上消费者天天的查找是7次,在移动查找上,通过语音帮手的查找行为,天天 可以达到15到20次 。
腾讯科技:有一个问题,中国有众多的方言,此外,好多人说一般话都说得不 标准, 比方说我以往用语音查找,但我的话假如不 标准,可能敲出来的字就不是我想要的,怎么解决语音查找中面临的这样的问题?我觉得这是很典型的问题 。
茹立云:这是语音 鉴别需要解决的问题,然而很 庆幸地看到在一些大众化的方言中, 比方说上海话、广东话,语音 鉴别技术已经 根本上 可以像一般话一样地把它解决掉 。同时在语音查找里,搜狗做了交互上的创新,siri仅仅 可以依据语音来查找,搜狗的话,假如你觉得这个语音是错的,还 可以进一步变成文字输入 。可能10次里9次语音是对的,另外一次是错的,那错的那一次还 可以用文本 修改 。这样你这种输入的成本还是大幅度减低 。
腾讯科技:好多人其实不想输入,然而他说的话又不太 标准,但又是一般话, 确定会遇到这种状况,怎么去通过语音含糊 解决,让消费者 可以更好地达到他想输入的 动机?
茹立云:目前语音 鉴别综合 威力在85%左右,10次里面可能有1次多是错的,同时我们也提供手动输入的交互 模式, 可以手动 批改语音 鉴别 后果,所以整体来讲 晋升还是很大的 。所以这个数据包含了全部中国各个地区的人群,确实会发现北方的 鉴别率显而易见高众多,南方会差一些 。
绝对而言,用语音查找引擎的人文化水平 比较高, 将来更大规模展开时,可能会有这种差异,但语音 鉴别里很主要的一块是语音数据 本身, 惟独这个地区的口音的人 可以有足够的数据,可能口音就不是太大的问题了 。 本身声音便是一个声波,不同的地区声波不一样,但还是有可能 可以 鉴别出来的 。
腾讯科技:国内像科大讯飞做语音很长 工夫,但觉得这一块国内 如同不是特殊成熟,至少用的人不是太多,语音查找这块国内面临的最大 挑战是什么?
茹立云:语音技术还需要进一步 晋升,像 方才说的85%,可能真正 使用过程中有些人觉得还是不 可以 承受的,由于 舛误之后要变成正确的成本很高 。第二个是 使用习惯的养成,毕竟众多消费者原来是传统互联网的,现在往移动互联网 迁徙, 。怎么让大家 构成这么一个习惯:我在手机上用语音做查找是很容易,这是一个过程的 迁徙,一个习惯的养成 。
美国的情境比国内好众多,还是 本身进展阶段与行为养成阶段,等大家真正体味到它的 好处,自然能把问题解决掉,但需要 工夫, 比方需要两年 工夫从语音技术成熟到消费者行为的转变 。
腾讯科技:从技术角度来看,语音帮手产品在开发过程中难点在哪些方面?
茹立云:这个产品分成这么几个 性能块来讲,第一块是语音 鉴别,不像拼音输入法,首选的正确率是90%多,但语音 鉴别现在正确率惟独80%多,而且用语音交互不像之前用输入法做进行二选那么容易 。语音 鉴别是第一道门槛,这个门槛迈不过去,一个主要的属性就没有了 。
语音帮手第二个属性便是智能,智能体现在几个方面 。首先是 查问 用意的 鉴别,一句话进来之后,它的 用意到底是什么?这是十分难的地方 。这跟查找引擎不一样,查找引擎之前众多 解决 绝对来讲是短的 查问,而这边会是一个 完全的句子 。
它需要查找引擎对自然语言 解决的积存以及消费者 查问 用意 鉴别积存 。同时需要长句 了解上的积存,搜狗输入法在这方面的积存会 比较多 。其次是 用意 鉴别之后对应 后果的精准性的匹配和 取舍,它会依赖于 本身的查找技术以及大量的数据 解决技术,这不是一个非查找引擎厂商 可以做的好的,它包含1) 根底查找的数据,由于消费者会有众多听小说、看图片的需要 。
2)大量智能的问答数据,便是问答上这种精准的匹配和抽取的技术 。问答的信息很 宽泛 。 可以通过这种技术,使得一方面在闲聊的时候,觉得它也是很智能 。另一方面在 实在的问答需要上,也能很好地匹配它的需要 。3)需要是面向领域的精准化数据查找引擎开放平台体系便是在解决这个问题 。
4) 常识计算体系,它 可以 解决更复杂的问题 。现在开放平台, 查问后面的答案是固定的,而 常识计算,它 可以依据 常识库自主地做众多复杂的计算 。 容易来说,刘德华哪年到70岁了,它就能告诉你哪年,这在原来的问答或者是开放平台里面都是解决不了的 。
另外一块像之前说了谁的老婆的什么什么,这种关系都 可以很好地推理 。或者中国历年GDP的增进, 常识库里面有每年GDP的数据,都 可以演算出来 。甚至中国历史上在位 工夫最长的皇帝是谁,都 可以通过整个数据库的计算来告诉你谁是 。
腾讯科技:您提到做语音帮手前对国内市场进行调研,能不能谈一谈各家的特色?
茹立云:语音帮手产品角度,我们调研 比较多的是siri和Google Now两个产品,我们会对这两个产品做一个 将来趋向上的研判,哪个更像 将来移动上的查找 。我们最后觉得siri这种 模式会是更接近 将来移动查找的 状态,但siri 本身在技术 威力上有 比较大的欠缺,由于它不是查找厂商,我们 可以在这个技术上做更多进一步的工作 。所以我们公布了 类似siri的产品,而不是Google Now,或是两个同时公布 。
第二块是语音技术上,讯飞在通用语音 鉴别上 存在率先优势,但 其余厂家也会有他们的优势, 比方像云之声的 鉴别 威力和讯飞差不多,但它 可以针对性的做众多特定的优化,这个优化包含:面向领域的语音 鉴别和当地的语音 鉴别 。
第三块是 用意 鉴别和后续服务集成上,这个非查找引擎厂商就会很 薄弱 。
腾讯科技:具体在语音帮手领域,现在各家是什么现状?
茹立云:目前国内主要的是搜狗语音帮手和讯飞语点,分别 存在 用意 鉴别、资源和语音 鉴别上的优势,后续 要害在于各 自由 施展优势的同时 补偿缺乏 。
腾讯科技:苹果是很 关闭系统,搜狗语音帮手假如在苹果平台推出,是不是缺乏推广优势?
茹立云:我们也看到这个一个问题 本身它是一个 关闭平台,第一步也面临着能不能上架的问题 。我们现在看到国内这些语音帮手的产品,还没有一家上架的 。从国际 规模来讲,会有一些上架的,都是很小的厂商,Google Now也是做了这种转变之后,变成Google语音查找了,上到了iOS系统上 。如何 威力上架是其中的一个问题,等待苹果有一天能更加开放 。
上架之后,由于它有内置的优势,关于这个产品, 本身对查找引擎的 了解,查找引擎的 威力以及当地化方面都存在着严峻的缺乏,假如做对照的话,其实它的 用意 鉴别和后续的服务上都存在着严峻的缺乏 。 绝对而言,苹果的消费者还是 比较高端的,一个好的产品,口碑有了,我在上面自然而然就会 流传开的 。现阶段安卓是我们的主打,同时我们iOS这个版本也在做 。我们也正跟苹果沟通,做 怎么 可以让我们上架的沟通的工作 。
腾讯科技:现在的下载量有多少? 将来搜狗对语音帮手有预期吗?
茹立云:搜狗语音帮手从公布到现在下载量破100万 。 盼望半年内能有上万以上的安装 。我们现在也会和众多厂商接触,可能1月份会公布一批 策略合作的 搭档 。
|
||
|