Board logo

标题: [新闻] Siri究竟牛在哪里?深入解析苹果的人工智能助理 [打印本页]

作者: silenty    时间: 2011-10-10 16:18     标题: Siri究竟牛在哪里?深入解析苹果的人工智能助理

不久前,苹果公司宣布下一代iPhone将启用一项新的语音识别系统:Siri。关于它的简介和部分发布会演示照片请参看果迷网之前的《Siri智能语音识别,iPhone 4S能够听懂你的话》一文。Cult of Mac则对Siri进行了一番深入的解析,看过此文或许能让你更有理由相信,人工智能已经走进我们的生活。

说道Siri,这是一道硬菜。可在Android上,这个功能一年前就有了,苹果不过是想在这方面“不输他人”,而且其功能也并非如此强大。对吧?

错。除了它确实是一道硬菜以外,其他的都错。

其实,Siri是十年内移动平台上最重要的事件之一。

对Siri持否定看法的人一般会分成两个阵营:一边会说它没什么了不起的;另一边会说Android上之前已经有了。这两方的说法都不正确。


Siri的意义相当重大
我们不妨先从Siri的血统说起。Siri直接发端于史上最大的人工智能项目:五角大楼的CALO项目。CALO是“Cognitive Assistant that Learns and Organizes”的缩写(会学习和组织的认知助理),这个项目汇聚了全球人工智能方面的顶尖科研人员。

整个CALO计划的带头人名叫Adam Cheyer,他现在也是苹果iPhone团队的工程总监。

在《麻省理工技术评论》的采访中,Cheyer说CALO早已开始探索如何把“对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考、服务代表全部融合到一个……模仿人类的助理中,帮助人们完成不同的事情。”

他形容说Siri计划就是寻求在一件消费产品中做同样的事情。其实,在过去的四年里,Cheyer和他的团队一直在钻研如何优化CALO,使其能够在一台强大的移动电话中发挥效用,每天都能被成千上万的用户使用。在过去一年半中,他们把主要精力放在Siri技术和iOS及其应用程序的整合上。

它不是单纯的“声音识别”。它是人工智能。当人工智能进入了你的手机,难道意义还不够重大?


Siri和Voice Actions是两码事
Android系统的Voice Actions也是一项伟大的技术,并已经被许多Android用户所熟知和使用。但说真的,它和Siri不是同一个层面的产品。

Voice Actions提供了非常坚实可靠的声音识别引擎,它的高识别度把曾经一度流行的语音识别工具都比了下去。

不过,和过去的所有语音命令系统一样,它要求你说的话严格符合一系列特定的语法,否则它就无法理解。

Siri和以前公众使用过的所有产品都不相同。你说的话可以和你想表达的意思在字面上毫不相干,从严格的技术上看也似乎是文不对题,但Siri会根据上下文、人类历史以及能够理解一般人类语言的人工智能去分析,并在多数情况下领会你的意思。

打个比方,你想小睡一会,并准备上个闹钟,只需要说“20分钟后叫醒我”。如果你想查阅后面的日程安排,你可以说:“我今天接下来都有什么事?”

这些语句中既不包括会用到的应用程序名称,也不包括所需数据的名称。Siri仍然能够理解。

对人类而言,这些句子再平常不过了。但要让机器去理解这些变化多端的棘手词汇,就是人工智能的圣杯了。

而更加人性化的特点是,一旦你开始和Siri进入一段对话,它甚至能理解许多含义模糊或者引申的语义。比如,你可以问它:“步行范围内有没有什么顶尖的意大利餐馆?”如果Siri查询后回答“没有”的话,你可以说:“那墨西哥的呢?”Siri会将你的这个问题连同上文的“顶尖的餐馆”和“步行范围”一道进行理解。

Android的Voice Actions做不到这样的事情,因为它是一个声控命令软件,而并非人工智能。

Siri有时会为你显示网页搜索的结果,有时能替你执行一些操作,有时能够直接控制iPhone里的应用程序。

而且Siri同样能够回答问题,这要归功于它整合的Wolfram-Alpha。你可以随机提问:“30英里是多少公里?”,“巴黎现在几点?”,“钢琴上有多少个八度?”,或者“天空为何是蓝色的?”Siri能够直接回答这些问题。不是唰地显示一个网页。就是回答你的问题。


关于Siri,重中之重是什么?
从历史和文明的角度来看,关于Siri,最伟大的事情并非人工智能本身。而是苹果通过Siri把人工智能带进了现实生活中。

理由就是:苹果将Siri做成了iPhone的一个核心组成部分,并且让它作为手机使用的主流,让每个用户都觉得除了使用很方便之外,更想时时刻刻都尝试使用它。

提到“主流”,我指的是捡起那些被人类文明边缘化了的东西,并使其成为大量人群每日生活的一部分。现在,Google出品的Voice Actions不得不面临被边缘化的境地。一般人甚至都没听说过它。

Siri会成为主流的。人们会逐渐熟知它,甚至包括非iPhone用户。

爱迪生并不是发明灯泡的人。他是通过产品设计和市场营销,将灯泡变为主流的人。

福特并不是发明汽车的人。他是通过控制成本和市场营销,将汽车变为主流的人。

我们总是记住那些将事物变成主流的人,因为正是这些人和公司让科学技术真正融入每个人每天的生活。于是,说道灯泡,它就溯源于爱迪生;说道汽车,它就溯源于福特。

Google的Voice Actions并非人工智能,虽说它确实让用户省去了打字输入、触摸操作的工序,只需要使用声音去控制机器就可以完成一系列事情。但是,Voice Actions最终没有让声控成为主流。或许一些极客们会学着使用它吧。

然而,妈妈们会选择Siri。


And One More Thing(还有一件事)
iPhone 4S也许会成为第一款支持蓝牙4.0的手机,这项技术可以降低能耗,同时可以做到一件非常特别的事:唤醒设备。

如果把Siri和这项无线技术结合起来,其使用范围就更加广泛了。例如,可以想象你戴着一款“超长待机”手表,它会一直睡眠,你触摸它才会显示时间,或者在iPhone收到短信时,手表会被Siri唤醒。你如果要和Siri交谈,只需要对着手表说话就可以了,甚至连手机都不用掏出来。

同样,可以试想一下,有这么一款桌面麦克风,当你说话时会唤醒iPhone,就像《星际迷航》里那样不用按任何按钮直接说话,并从企业号,呃我是说iPhone的人工智能,得到回应。

那么让我们来总结一下Siri对于人类而言意味着什么。Siri是人机交互新纪元的黎明,是大众进入真正的人工智能时代的开端。

当然,目前它尚未达到完美,苹果目前将其定位在“beta”阶段。并且,它也还不是你在科幻电影里看到的那种无限高能的人工智能。

但它的步伐远未停止。iPhone 4S里的Siri只是一个开端。相信以后会有更加复杂的版本出现。

Google、微软和其他公司也终会拿出自己的人工智能产品的(并且我预言就是按照这个排序)。

所以,一旦你最终和Siri搭上话了,请善待它。Siri具有非常非常重大的现实意义,和以往任何产品都不同。它能够代表计算机发展的一个新纪元。当然,它会让每个人都“说”起来的。
作者: 小文    时间: 2011-10-10 17:09

这篇文章我也看了,过于高科技了。。。

鉴于苹果在发布会上也强调这是个beta版,我对实际运行状况不敢太乐观
作者: zo    时间: 2011-10-10 17:20

希望siri能在2.0或者3.0版本达到文中描述的效果
作者: zhaolinjia    时间: 2011-10-10 17:48

posted by wap, platform: iPhone

擦,为什么只有4s才能用?
作者: zhaolinjia    时间: 2011-10-10 18:09

posted by wap, platform: iPhone

擦,为什么只有4s才能用?
作者: sarion    时间: 2011-10-10 18:12

一句话,公共场合用声控的操作实在太傻了,隐私什么的也就不说了,脑袋被枪打了才会用声控。

我只有在开车时候要打电话不方便才用声控拨号的……

赶紧开发意念模式才是正道!233max
作者: 小文    时间: 2011-10-10 18:23

posted by wap, platform: iPhone

美国本来就是汽车王国,keynote的演示也说明了siri的适合场合
作者: zhaolinjia    时间: 2011-10-10 18:41

posted by wap, platform: iPhone

可以预见不久的将来,星巴克将会有无数人对着手机自言自语,

一句话,你的iphone不能talk,你就弱爆了!因为你不是4S!
作者: realbobo    时间: 2011-10-10 21:16

为毛我总想到电话窃听呢?
以后要学习暗语了,长江长江,我是黄河,我是黄河~
作者: iceliking    时间: 2011-10-10 22:41

对开车人士太好不过
作者: ooo    时间: 2011-10-10 23:18

posted by wap, platform: iPhone

现在的一些知名数码站都被指责果粉向。。。
作者: sectionboy    时间: 2011-10-10 23:42

2010年4月siri才被apple收购。在那之前是个99分的app,现在捧臭脚的又有多少人知道。:D
作者: dirge    时间: 2011-10-11 01:43

本来ios的语音控制我上下班路上听歌时就总用了,希望这次变身希瑞之后能更精确点。
作者: tanglee4950    时间: 2011-10-11 07:21

posted by wap, platform: HTC

天网的主脑原型----siri
作者: 雒小猫    时间: 2011-10-11 08:24

引用:
原帖由 zhaolinjia 于 2011-10-10 18:41 发表
posted by wap, platform: iPhone

可以预见不久的将来,星巴克将会有无数人对着手机自言自语,

一句话,你的iphone不能talk,你就弱爆了!因为你不是4S!
问题在。。。你对talkbox也可以自言自语的吧。。。。
作者: gunsou    时间: 2011-10-11 08:50

“然而,妈妈们会选择Siri。”

COM的原文作者是个强大的隐性果黑。。。。话说这个句式怎么记得以前在任黑文里经常出现?果然果任是一家
作者: fhqwb    时间: 2011-10-11 09:17

呻吟两声
啊啊啊啊
作者: survivorcn    时间: 2011-10-11 09:54

posted by wap, platform: Nokia (E66)

如果能够成功的话,的确会是一个划时代的产品。语音控制本来就不适合在室外嘈杂的地方使用,这一点就不要拿来黑了。

本帖最后由 survivorcn 于 2011-10-11 09:55 通过手机版编辑
作者: 骷髅上帝    时间: 2011-10-11 10:03

能不能设置成自定义主人名字,哈咯,阿姆罗,哈咯阿姆咯。
不过以后泡TG方便多了,
帮我搜索一下TGFC ZHAOLINGJIA有几个马甲
IP4S:根据他发帖的频率不能确定。

那你分析一下IP地址,给一个综合结论我
IP4S:分析IP地址需要下载XXX软件,需要下载吗?

好的,找一个免费的
IP4S:已经下载完毕,分析出XXX,XXX,XXX都为他的马甲。

很好,你把这些信息发去TG的水区
IP4S:已经发送成功,如果有人回复我会第一事情通知你。

[ 本帖最后由 骷髅上帝 于 2011-10-11 10:15 编辑 ]
作者: lvcha    时间: 2011-10-11 10:40

再发展2年郭德纲就下岗了。
作者: sadine1985    时间: 2011-10-11 10:56

引用:
原帖由 骷髅上帝 于 2011-10-11 10:03 发表
能不能设置成自定义主人名字,哈咯,阿姆罗,哈咯阿姆咯。
不过以后泡TG方便多了,
帮我搜索一下TGFC ZHAOLINGJIA有几个马甲
IP4S:根据他发帖的频率不能确定。

那你分析一下IP地址,给一个综合结论我
IP4S: ...

作者: aso    时间: 2011-10-11 11:58

在眼下,这文章大部分都是YY。。。
作者: dirge    时间: 2011-10-11 12:59

希瑞还要多久才能学会说中文?
作者: jamesryo    时间: 2011-10-12 14:01

我要是问它~我帅吗~它会怎么回答?
作者: lonesomer    时间: 2011-10-12 14:31

引用:
原帖由 jamesryo 于 2011-10-12 14:01 发表
我要是问它~我帅吗~它会怎么回答?
请定义“帅”……
作者: migiry    时间: 2011-10-12 14:34

引用:
原帖由 雒小猫 于 2011-10-11 08:24 发表

问题在。。。你对talkbox也可以自言自语的吧。。。。
还有疼讯的微信




欢迎光临 TGFC Lifestyle (http://club.tgfcer.com/) Powered by Discuz! 6.0.0