百度宣称推出一项黑科技,这次不是外卖,而是要“消灭键盘”!
3月22日,百度举行了一场语音搜索开放日活动,向媒体展示自己正在蓄力的最新技术应用——语音搜索。百度副总裁王海峰介绍了百度在语音搜索上所取得的突破。同时表示,语音交互将是人机交互的趋势所在,这个趋势将取代键盘输入。
或许是因为前阵子AlphaGo激战李世石时,网友调侃“谷歌的人工智能已经赢了世界冠军,可百度的黑科技还是送外卖…”,这句话激发了百度的狼性,所以这次急于对外展示语音搜索的技术。但笔者在此先泼一盆凉水,百度提出的用语音搜索“消灭键盘”,恐是一厢情愿。
先驱:Siri、度秘先后沦为“鸡肋”?
检验一款产品能不能火,有没有钱景?很简单,只要苹果一加入,大致就能验证出来。
在iPad问世之前,微软、三星的平板电脑推了很多年,都没起来,iPad一经发布,很快风靡全球,iPad带火了整个平板市场。同样,iPhone也带火了整个智能手机市场,甚至,Macbook Air还让夕阳的笔记本电脑市场再次焕发新春。但在语音搜索领域,至少到目前,Siri却遭遇了“滑铁卢”。
苹果Siri语音助手刚推出之时,着实新鲜了一把,也被寄予普及语音搜索的厚望。而随后呢,竟然沦为了被“调戏”的小玩具。
在360搜索上输入“调戏siri”,迅速出来“中文调戏siri、如何调戏siri”等各种联系词语,结果中有各种视频、搞笑图片、调戏攻略、siri猥琐对话等等。而在百度搜索上,“调戏siri”出现了100多万搜索结果。知乎、AB站上调戏siri被讨论的不亦乐乎。
的确,Siri语音助手多么有趣!但问题是,当一个产品的主要功能变成了被“调戏”,那它说白了也就算是个玩具。而玩具的命运是,时间长了,玩腻了,就会被束之高阁,或者干脆扔掉了事。苹果尚且如此,其他类似产品肯无法逃脱这种命运。
比如,去年百度世界大会上,李彦宏雄心勃勃的展示了机器人“度秘”,号称吃喝玩乐的专属秘书,但随后就迅速沉寂下去。百度指数更从刚发布时的25万,迅速跌到1000多,已经逐渐被人们所淡忘。
语音搜索缘何火不起来?
究竟是什么原因,造成Siri、度秘等语音助手类产品不温不火呢?笔者认为主要是以下几方面:
1、初衷想全民通吃,却模糊了应用场景
Siri刚刚推出时,可谓雄心壮志,各大媒体密集报道和用户热捧,让其出生就戴着耀眼的光环。Siri面向的用户是泛大众,男女老少,没有刻意指定应有场景。但这样的结果就是,用户开始抱着好奇心、新鲜感,漫无目的的尝试,刚开始的确觉得有趣,好玩,但时间长了,好奇心很容易散去,就不再有新鲜感,不再多次使用了。
如果Siri推出时锁定部分人群的特定需求,拉低用户的期望,提升特定需求的体验,或许能赢得更好的口碑。
2、技术成熟度和理想需求 仍存在距离
如果你不仅是为了娱乐,而是将语音助手作为工具,包括siri在内的语音助手,在语义分析和识别准确性都有很多不尽人意的地方。对模糊、不标准的发音,以及容易引起歧义的句子,大部分语音助手都表现为“听不清、听不懂”,当你着急寻找答案时,重复喊了几次都得到莫名其妙回答后,你已经忍不住发飙了。
语音搜索是一个整体性的技术集合,在前端主要是语音识别以及语音合成技术,后端则包括搜索技术、知识库技术、问答和推荐技术。因此达到全民通用的理想状态,还有很长的距离。
3、智能设备的形态比较单一
在使用电脑的场景下,有键盘的帮助,语音助手基本没有用武之地。Siri主要引用在iPhone上,国内科大讯飞的语音搜索技术,也主要用在手机APP上,但大部分用户用手机触屏时,感觉还是比较方便的,对语音助手的依赖度也不大。
另外,很多智能机器人开始问世,比如小i机器人、荣乐机器人等等,他们也以语音识别为卖点,但这些产品大都是展示和高级玩具阶段。其他很多带有一定人工智能的智能硬件设备,国内目前还在发展初期。
在乌镇互联网亮相的小忆儿童陪伴机器人
已经普及的产品,电脑、手机,对语音搜索依赖不大;需要语音搜索的产品,尚没有普及起来,或许这些,是造成语音助手类产品尴尬现状的原因。
未来可能出现的突破点在哪里?
那么,语音搜索的真正爆发期,或者春天,到底在什么时候呢?笔者认为,语音搜索是未来的发展趋势,这点毋庸置疑,如果沿着以下路径,或许爆发期将更早到来。
1、循序渐进,先从细分领域切入
Siri、度秘的前车之鉴告诉我们,即便是巨头,也不能通吃大众化的需求。因此,先从细分领域切入,也许是一个不错的选择。
例如在智能电视、智能音响领域,一方面有刚性需求,这些设备的控制器往往是遥控器或者按钮,输入麻烦,比如我想在电视上,用遥控器输入很复杂的电影名或电视剧名,远不如语音搜索方便。想通过智能音响听首歌,用语音喊出歌名、明星名字,如TFboys、吴亦凡、华晨宇,甚至是某句歌词,音响就可以搜索并自动匹配了,这种便利性,才能充分体现语音搜索的优势。
另一方面是场景需求更集中,降低技术门槛。如果语音知识库过于庞大,技术门槛高,出错几率也会大。如果集中在电影、娱乐、音乐等界定清晰的领域,相对更能获得更准确的答案,提升用户体验。例如目前360投资的咚咚智能音响,就在逐步融入360搜索的语音搜索技术,已经获得了极为准确的人机互动体验。
类似还有儿童手表、车载导航等设备,他们的语音助手,都是很对特定细分人群,相对更容易实现突破,出现成熟性产品。
2、更接地气 软硬件技术充分整合,
语音搜索是一项较高端、前沿技术的领域,行业也具有浓重的工程师文化,但这样容易导致很多推出的产品,过于超前,而不接地气。
其实,很多日常普及的硬件设备,都对语音搜索有很强的需求。例如儿童手表,如能听懂小孩的问题,能帮儿童讲故事、讲笑话、解答问题、陪伴聊天,势必将充分发挥语音搜索的优势。如果对硬件市场没有前瞻预测和准确洞悉,语音搜索会停留在概念层面。
目前,百度在语音搜索开放日上,对外表示不会涉足硬件,未来将采用和硬件厂商合作的开放式战略。360则选择了软件和硬件并行发展的战略,周鸿祎在2014年就开始宣讲其IOT(万物互联)战略,并推出了360儿童手表、360智能摄像机、360行车记录仪等产品,智能硬件的矩阵布局略见雏形。目前这些产品开始逐步采用360搜索的语音搜索、大数据处理、知识库学习等人工智能技术,在市场上获得一定的反响。
科大讯飞在语音识别方面起步较早,且比较专注,目前已经和很多硬件厂商形成广泛的合作。在商业应用方面,科大讯飞走在了百度、360搜索这两大搜索巨头的前面,不过未来随着应用场景的增多,设备越来越复杂,对于人工智能的技术积累,极可能成为科大讯飞的挑战。
因此在当下之际,高喊“消灭键盘”是没有太大意义的,推出爆款型的语音类智能硬件,才是当务之急。