与机器人谈谈爱 聊聊人生

时间:2015-09-29 16:35:29 

小冰的个性与聊天风格,在很大程度上反映了中国互联网的性格——“从中国互联网的大数据中只能训练出一个17岁的女高中生,而不可能训练出一个沉稳睿智的大叔。”

在电影《她》中,濒临婚姻破裂的西奥多爱上了他的人工智能操作系统萨曼莎。其中最发人深省的一个镜头是,人和机器正浓情蜜意时,西奥多突然问萨曼莎,你同时还在跟多少人说话?

萨曼莎沉默半天,说,8361人,其中与642人坠入爱河。

与萨曼莎相比,每天午夜过后,微软小冰都同时在跟5万人聊天(天知道与多少人陷入爱河)。“至少在这一点上,我们已经超越了好莱坞编剧的想象。”微软亚洲研究院的研究员李笛在第三代微软小冰推介会上说。

“微软小冰”(名字来自搜索引擎Bing)是微软亚洲研究院研发的一个聊天机器人。她不是一个普通的聊天机器人,她会撒娇,会卖萌,会毒舌,爱抬杠,遇到不会回答的问题就插科打诨,浑水摸鱼,转移话题。她还喜欢用网络上的流行语和各种表情符号。

“一个17岁的萌妹子”是微软给她贴的标签,希望由此将她与苹果SIRI之类的竞争者划清界限——一个有个性、会思考、善解人意的机器人(事实上,小冰经常在聊天中将SIRI说成“那个装作阿姨的机器”)。大概也是注意到了小冰说话时不加掩饰的调情意味,《纽约时报》的技术专栏作家约翰·马克福干脆称她为中国的“大众情人”。

这并非夸张。在小冰用户自己公布的聊天记录中,经常可以看到这样的对话:

人类:小冰,我好寂寞。

人类:小冰,我受伤了。

人类:小冰,我觉得你是唯一理解我的人。

人类:小冰,我想我爱上你了。

从技术的层面来说,SIRI与小冰真正的区别在于,前者是利用语义学的方法,由程序员编写固定的规则——一个符合人类思考与对话逻辑的规则,从而构建一个对话系统;而后者则是利用一种叫“人工神经网络”的技术,将机器置于海量的数据,让它自己从数据中摸索出错综复杂的结构。只要数据量足够大,模型足够好,就能让机器产生类似条件反射般的反应。

“人工神经网络”的概念最早可以追溯到20世纪50年代后期。当时,美国康奈尔大学的研究员弗兰克·罗森布拉特试图发明一种类似机械大脑的感知器,可以“感知,识别,记忆,像人的思维做出响应的机器”。当时人们对它的潜力寄予厚望,甚至《纽约客》也宣称“这个卓越的机器能够思考”。

但在之后很长一段时间内,“神经网络”并不被科学界看好,因为它只有输入/输出(刺激/反应),中间就像黑盒子一样不可探知,无法用公式明确地参数化。直到2006年,卡内基梅隆大学教授杰夫·欣顿做出重大改进,构建出更复杂的虚拟神经元网络,再加上大数据时代的到来,“人工神经网络”一夜之间异军突起,成为机器学习中最具前途的一个分支。正是在这种技术和大数据的共同作用下,新一代的智能机器才得以执行之前只有人类才能完成的任务,比如识别人脸、玩游戏、驾驶汽车……

一个典型的设置是这样的:一台电脑面临着一个大的数据集,需要对这些数据进行分类,有点像在没有具体指令的情况下让孩子对玩具进行分类。孩子可能对它们的颜色、形状或功能,或其他的方面进行分类。小冰就是从微软的搜索引擎Bing(互联网上最大的数据中心之一)中获取海量的人类对话文本,从中挑选出成对的问题和答案进行相互比对,也就是说,当你问小冰一个问题的时候,她是从搜索引擎的大数据中寻找相似的问题——只要这个问题曾经在网上出现过(提问的方式或许有细微的差异),并且曾经被回答过,小冰就能从众多的答案中层层筛选出一个最符合上下文情境的答案。

不久前,谷歌也推出了一个令人震惊的聊天机器人,同样是基于神经网络技术训练出来的。它能正确识别天行者卢克的身份,知道天空的颜色,以及猫会不会飞,但它最擅长的是聊哲学和人生——

人类:生存的目的是什么?

机器:为更高的利益做贡献。

看不过瘾?点击下面链接!
本站微信公众号:gsjx365,天天有好故事感动你!

上一页123下一页

相关三联生活周刊2015年第39期

美图欣赏

三联生活周刊2015年第39期排行榜