本文共 1766 字,大约阅读时间需要 5 分钟。
手机语音助手已发展多年,随着近几年机器学习的发展,语音助手在语音识别、语义理解等方面已经有了很大的发展。Siri、小娜这些我们都已经听过很多了,但在国内,手机端智能助手有哪些呢?它们现在的表现如何呢?我们以十一假期五个场景来做一番比较。
注:为了方便比较,四家手机智能助手皆为客户端APP
可以看出以上四家在界面设计上,出门问问使用酷黑色,整体看起来比较炫酷。另外几家(度秘、灵犀、深思考)则使用白色或者浅灰色作为背景。
情景:十一假期是一次难得的多年老友聚会撸串的机会,让我们试试四家助手怎么带你去撸串~
三轮对话:
>> 附近有什么好吃的?(意图识别)
>> (饭店名)怎么样?(个性化推荐)
>> 给我导航一下
出门问问在第一轮中识别出用户的意图,并接入第三方软件“大众点评”的结果;对于随后的问题出门问问给出的答案就完全不相关了,它们就没有没有对上下文的理解和记忆了,有可能是在美食这个垂直领域他们没有采用多轮对话的技术。
灵犀也一样:
度秘会把结果引导到另一个页面(度秘美食),不过这并不影响它接下来的两轮对话。
深思考则完全在自己的平台上展示结果,并在随后的两轮对话中表现良好:
情景:八天长假,难得家人团聚,一起收拾行李,出门旅行~
两轮对话
>> 帮我定个明天早上去上海的机票(意图识别)
>> 追问(多轮对话)
度秘接入携程网
灵犀接入携程网。我们可以看到灵犀给出的结果会按照第三方的推荐,例如排在第一的是一条邻近路线和一张晚上8点多的低价票,而不是早上的机票。
出门问问同样接入携程网,但相比前两者结果却要好很多。
深思考在自己的平台上完成整个订票的交易,秒杀两轮对话。
多轮对话
>> 帮我查一下后天从上海到北京的高铁
>> ......
其他几个平台和订机票一样,都只进行到第一步便接入第三方平台。而深思考可以完成高达七轮的对话。
情景:假期来了,手挽女神,自然要约约约啦!你懂得~
不限轮数
>> 帮我在中关村附近订个酒店
>> 大概200到300元之间
>> ……
度秘、灵犀沿袭它们一贯特点:一旦接入第三方服务,就不再具备上下文理解能力了。
深思考也和前面一样,在自己的平台上通过不可思议的八轮对话,完成了整个订房交易,并启动导航。
值得注意的是,出门问问在这里也表现出了多轮对话的能力。所以我们可以猜测出门问问也具有一定的多轮对话技术,但在搜索结果中难以应用多轮对话。
情景:一人的夜总是最寂寞,压着马路,赏着秋月~
单轮对话
>> 我不顺心,有点郁闷,很郁闷
这时出门问问会讲一个笑话
深思考会先为你放首歌舒缓一下心情,再利用机器学习根据以往听歌的爱好,推荐放松心情的歌,有点温暖小贴心哦!
度秘和灵犀的回答就很无厘头了
这些和小冰比起来显得真的很鸡肋,还是去调戏小冰吧。
情景:没有发神经,就是想测试一下~
>> 打开QQ,打开微信,打电话
在这方面,度秘和灵犀表现很好。
出门问问:打开QQ、微信失败。
深思考:失败。
通过多次试验发现,度秘、灵犀、问问都能够拨打电话、发送短信,灵犀甚至还能打开相机,但另外几家做不到这些。而深思考在涉及第三方软件时毫无招架之力,仅在某些特定场景下可以调用打电话功能,比如“打电话给这家餐厅”。
可以看出,国内这几家智能手机助手在跨APP指令方面,目前还是处于基础阶段。不过话说,谁会闲着没事用一个APP去打开另外一个APP呢,除了小编!
从上面简单的测试中可以看出四家手机智能助手各有千秋。
度秘和灵犀在系统以及集成度上做得相对较好,但看起来并不能进行多轮交互。出门问问无论在界面还是用户体验上都很不错,也能进行简单的多轮交互,整体感觉比较流畅。深思考则在多轮交互方面做得非常漂亮,除此之外,它的另一个特点就是,几乎所有的任务都会在自己app内一站式完成。
总体来说,国内的智能语音助手在某些垂直细分领域远超Siri等大牌语音助手(你可以把上面的评测对着Siri说一遍),但如果想要做到全面超越,依然还有很长的路要走。