大数据时代的知识论

美国哲学家迈克尔·帕特里克·林奇提出，在大数据时代，我们能够方便、迅速地获取信息，我们知道得更多了，但懂得却更少了。

搜索到的信息

如果你身上带着手机，就随时可以搜索某个问题的答案。但为什么在网络时代，关于真相和观点的争论越来越多了呢？林奇在《我们的互联网》一书中说：“互联网给了我们更多信息，它使我们更容易地挑选那些确认我们已有观点的信息源。”他认为，如今获取信息变得特别方便、快捷。“文字使我们能够做时间旅行，互联网则使我们能够跨越空间的鸿沟来交流，我们不再需要前往某个地方寻找所需信息。”但数字手段会削弱和破坏我们其他的认识方式，那些认识方式需要理解，需要更有创造性地、整体性地把握信息是如何连成一体的。

他写道：“我们以前说眼见为实，现在我们可能要说网上搜到的为实。但这也使得人们更容易相信奥巴马是穆斯林或者麻疹疫苗很危险。正如我们往往看到我们想看到的东西，我们也往往会去搜索我们想搜的东西。在数字时代，我们能够获取更多的信息，但在其他方面我们知道得更少了，数字生活的墙壁使得我们更难获得真正客观的知识，互联网助长了一种更被动的、更顺从的认识方式。我们可能会过于依赖某种认识世界的方式而导致我们其他的感知变得迟钝。”

搜索到的信息特征是什么呢？我们把搜索引擎当作一个图书馆员，我们问他们问题，他们给出声称拥有答案的信息源。但谷歌并不是一个人，它不创造信息，只是分发信息。我们从谷歌点过去的链接给出的信息是其他人提供的。如果我们信任它，我们信任的是其他人的见证。“实际上，整个互联网，包括维基百科、脸书、推特，就是一个通过见证获得知识的机器。如此获得的信息和知识方便、快捷，但依赖于他人。我们还认为这种知识更有价值、更自然。”

问题在于，我们倾向于自动地信任我们的获取能力。“有机体要想找到食物、躲避天敌，就需要能够快速、机械、可靠地把正确信息跟错误信息区分开。当我们早晨睁开眼睛看闹钟时，当我们闻到咖啡的香味时，当我们想起我们要迟到时，我们都在获取信息。当我们四处走动时，我们会下载非常多的数据，然后被我们的感官和神经系统处理成信息。”这些信息反映了我们周围的世界，但我们被动接收到的知识不是知性的，狗、海豚和婴儿也是这样认知的。为了拥有这种知识，你无须知道，你甚至不用知道“知识”这两个字是怎么拼的。关键在于，一个有机体对其接收能力默认的态度是信任它。即使我们知道视力和听觉会误导我们，但没有它我们就无法生存。这种知识还是不加反思的，它们不需要积极的努力。当你在手机上查东西时，你得到的信息并不是你付出许多努力的结果。你是在从事一种快速的、相对非反思的认知过程。我们通常还信任这些用数字方式获得的信息。

客观性和理论并未终结

拥抱互联网的人认为网络颠覆了许多传统的认识论概念。互联网理论家大卫·温伯格提出，在数字时代，客观性已经不重要了：1996年，《职业记者道德规范》不再把它当作官方价值观。温伯格说，这部分是因为人们总是从某个视角来理解他们的世界，而客观性依赖于一个形而上学假设：客观性向读者承诺，新闻报道展示的世界消除了个人的、主观的成分，提供的不是源于任何视角的观点。在温伯格看来，客观性是一种幻觉，因为不存在不带视角的观点。林奇说，这并没有排除客观性，因为做到客观并不需要不带视角的观点。“真理之所以客观，是因为使它们为真的不取决于我们。一个人是客观的，是说他对理由很敏感，清楚自己的有限性，知道自己的一些观点可能不是源自理由，而是源于自己的偏见、自己的视角。”

温伯格认为，做到客观这一需要源于纸张、印刷文字是一种静态的媒介，它迫使人们把读者理解一个主题所需的一切都包括进去。在他看来，互联网用透明取代了客观性，但“透明之所以有价值，是因为我们注重客观性”。

2008年，《连线》杂志编辑克里斯·安德森撰写了一篇文章，题为《理论的终结：数据洪水导致科学方法过时》。他声称，大数据分析正在颠覆传统的科研方式：“在这个世界，大量的数据和应用数学在取代所有被运用的工具。赶走所有关于人类行为的理论，从语言学到社会学。忘掉分类学、形而上学和心理学。谁知道人们为什么要那么做？关键在于他们做了，并且我们可以跟踪和测算它。有了足够多的数据，数字自己会说话。知道相关性就够了。”我们不用寻找模型了。无须假设数据能说明什么就可以分析它们。我们可以把数据扔进巨型计算机中，让统计学算法去寻找科学找不到的模式。传统科学理论的目标是建构模型，收集数据只是第一步，科研要做的是建构一个关于事件如何、为何发生的模型来解释数据。安德森认为，传统的观点假定的是数据总是有限的。而这个假定被大数据推翻了。

理论真的终结了吗？林奇说，答案是没有。托马斯·库恩在《科学革命的结构》一书中说，我们无法不预设一个理论而直接看数据本身，数据总是承载着理论。对世界的观察总是会受到以前的观察、经验和信念的影响。这些信念会产生一些期待。总而言之，理论渗透到了数据中。这种影响甚至会决定人们使用何种实验技术或设备，如库恩所说：“自觉或不自觉地，决定使用某种设备并以特定的方式使用它，都假定了只会出现某种情况。”

另一位大数据的倡导者鲁德尔说，地震发生后，可以从推特上的反应跟踪“情绪震中”，这样的话不需要知道地震的其他情况，就可以决定该如何向灾区的人分配援助物资。作为指引，推特上的反应的轮廓远远优于传统的围绕震中的冲击波。按林奇的分析，鲁德尔这种说法依赖于几个重要的假定：首先，他假定了救援人员不关心余震（对此传统的地质学数据预测得更好）。其次，它假定了所有类型的地震会带来同样可辨明的推特上的反应。但如果人们受伤严重到无法打字的地步呢？第三，它假定了人们都有智能手机，而且他们的当务之急不是救援伤者，而是发推特。这说明，数据相关性只有在特定的背景假设之下才有用。而这些假设正是源于理论。

美国艺术史专家马克西米兰和他的同事制作了一个文化史地图，他们收集了2000多年间15万个杰出人物出生和死亡的时间与地点，显示随着时间的推移，文化如何移动——有时聚集在某个城市，有时非常分散。马克西米兰开展这一项目是为了说明，历史研究跟科学研究一样，也可以使用数据而不是理论来显示相关性。林奇说，他的数据地图依赖一系列假设：他选取的杰出人物几乎全是欧洲男性白人；他的其他假设涉及如何定义文化；他认为文化是由科学家、电影明星等杰出人物推动的，忽略了经济和政治力量的作用；其他假设涉及如何衡量文化的漂移。“为什么一个人死亡的地点比他最多产的岁月所处的地方更有意义？比如笛卡儿死于瑞典，但他多产的时候大部分是在法国的时候。”

主笔薛巍

赞一个 (0)收藏 (0)

看不过瘾？点击下面链接！

大数据时代的知识论

相关三联生活周刊2016年第18期

三联生活周刊2016年第18期排行榜