Google跟对手的「过滤泡泡」论争︰用无痕模式搜寻仍得到「度身订造」结果

导读 现时不少人均会用Google搜寻资讯,然而未必太多人注意到,每个人搜寻得出的结果或多或少都有所不同。 自2005年起,Google在其搜

现时不少人均会用Google搜寻资讯,然而未必太多人注意到,每个人搜寻得出的结果或多或少都有所不同。

自2005年起,Google在其搜寻器加入「个人化搜寻」(personalized search)功能,搜寻结果排序不单取决于跟关键字的相关程度,更会透过用家的数据「度身订造」。到了2009年,即使没有登入帐户Google仍可按照记录提供个人化搜寻服务,其后更收起「停止显示个人化结果」的按钮。

网络行动者帕理泽(Eli Pariser)把科技公司提供个人化资讯,以致用户较难接触到其他不同意见的忧虑称为「过滤泡泡」(filter bubble)︰假如我们搜寻资讯时,只能够找到自己想看的内容,那就很难知道其他想法,令人们更容易趋向极端、更难理解别人立场。

个人化搜寻结果佔多少? 2017年一项研究发现,Google搜寻结果当中平均有11.7%为个人化结果,但不同议题的差异有别。

在今年6月,主打私隐及避免「过滤泡泡」的网络搜寻器公司DuckDuckGo招募了87名义工,协助测试Google的个人化搜寻结果差异,并在上周二(4日)发表结果。根据该公司的报告,即使登出Google帐户以及使用「无痕模式」搜寻,Google仍然会提供个人化结果。

不过Google反驳指测试方法有问题,强调搜寻结果有别源于其他原因。

DuckDuckGo的测试

DuckDuckGo表示,87位义工在今年6月24日东岸时间晚上9时顺序搜寻「枪械管制」(gun control)、「移民」(immigration)及「接种疫苗」(vaccination)三项议题,他们首先用「无痕模式」及登出Google搜寻,然后再以正常模式搜寻。76人使用电脑,11人使用手机。

根据DuckDuckGo的分析,他们共有以下四项发现︰

一,大多数用户见到的结果都是独特的。各个搜寻结果之间的差异,不能以「地点不同」、「时间有别」、「登入Google」或「Google在一小撮用户身上测试演算法」解释。

二,在首页显示的搜寻结果中,Google向部分参与者提供的一些连结,并未显示在别的参与者搜寻结果首页上,即使登出Google并使用无痕模式亦一样。

三,搜寻结果页上的「焦点新闻」和「影片」资讯箱(infobox)内容亦有显着差异,即使在同一时间搜寻,仍会得到不同的资讯来源(这排除了地点的影响)。

四,无痕模式及登出Google无法使人免于「过滤泡泡」的影响。这些方法不会如大多数人预计般令你匿名。事实上,不可能使用Google搜寻而避免「过滤泡泡」。

Google反驳

在DuckDuckGo发表报告后,Google发声明指这项研究「方法错误、结论误导」,认为原因在于DuckDuckGo把所有搜寻结果差异都视作个人化搜寻的结果。声明又指多项因素会导致结果有些微差异,包括时间及地点,并认为该项研究未有控制这些因素的影响。

Google搜寻的公共联络Twitter帐户亦发表帖文反驳,指搜寻结果并不经常个人化,而且一般不会大幅度影响结果,而搜寻结果有分别通常源于其他原因,包括地区、语言、时间、装置等。

该帐户解释,Google的数据中心持续更新大量数据,虽然他们尽量令改变同步进行,但仍有可能出现时滞,导致显示不同结果。帖文宣称即使相隔几分钟,搜寻结果亦有可能已经更新,从而出现差异。

近来Google宣称只有小量搜寻结果经个人化处理,而且通常是当关键字有歧义的时候,原因是个人化未必能带来更準确的搜寻结果。

如何理解这项测试结果?

DuckDuckGo是Google的竞争对手,其定位为注重私隐、破除「过滤泡泡」的影响,因此这项测试显然有利益冲突,或会令结果出现偏差,应保持怀疑。不过DuckDuckGo在明确描述测试方法之余,也公开数据及程式码供外界分析,曲解数据的可能不大。

而且DuckDuckGo所设计的测试方法,已经考虑到时间和地点差异,例如要求参与者同时间按其规定的次序搜寻特定字眼,以及在分析时把属地区性的新闻来源分开处理(将所有地区新闻视作相同来源),并指出对结果影响不大。

至于Google的反驳,则未有明确指出DuckDuckGo的方法有何错误,但按照该公司的回应去推断,应包括以下两点︰

未有準确记录寻搜时间的差异(因为Google宣称相差几分钟也会影响结果); 在分析各个搜寻结果的差异时,未有将参与者之间的距离纳入考虑(因为Google指数据中心未必同步更新结果)。

然而若对DuckDuckGo的测试有此严格要求,Google方面应首先为两项宣称提供证据,并证明参与者见到不同结果,并非因为个人化搜寻所致。

「无痕模式」的用途及限制

现时各大浏览器均设有「无痕模式」(又称「私隐模式」、「私密浏览」等),听起来似乎比较安全。

启用无痕模式时,浏览器会开设新资料夹存取浏览记录、cookies及快取(cache)档案等资料,当关闭无痕模式视窗后这些资料便会删取,而且使用无痕模式时,浏览器无法读取原本的cookies,因此不会自动登入帐户。

然而使用无痕模式只是浏览器本身不留下记录,不代表你能够在网络上隐身——你的网络供应商(ISP)能够记录你上哪个网站,而你连上的网站亦可保存相关记录。此外每个人所用的硬件、作业系统和浏览器均有不同,这些差异足以让网站为每个浏览器製作独一无二的「指纹」作记录。

简言之,使用无痕模式上网,网站仍然有办法辨认用家身份。

诠释结果问题

DuckDuckGo分析测试中各参与者的搜寻结果,比较各组结果的相似程度,发现使用无痕模式和正常模式搜寻时,平均而言结果有些微差别,相比之下,不同用户之间使用无痕模式的搜寻结果差异更大。

若按照DuckDuckGo的理解,这项结果代表Google的个人化搜寻影响明显存在,因为不同用户——即使已开启无痕模式——所得结果有显着差别,而且远比是否使用无痕模式(及登入Google)影响更大,这亦说明用上无痕模式仍会被Google追蹤及辨认到身份。

然而另一方面,若按照Google的解释,不同用户所得结果的差异并非个人化所致,而且Google甚少使用个人化排序,那么正常模式及无痕模式结果差别不大,倒可能印证了Google的说法——没有cookies不会影响搜寻结果。

到底应该相信哪一方?恐怕要等独立的第三方尝试重複实验,而且Google更公开透明讨论其搜寻个人化排序问题,我们才能够有充分资料下判断。

相关文章︰

你登入网站、滑手机的小动作,也可能被记录下来辨认身份 曾参与「蜻蜓计划」前工程师爆料 指Google高层遏制内部反对声音 德研究员分析「匿名」浏览记录,竟可发现法官爱看哪类色情片

资料来源︰

Measuring the "Filter Bubble": How Google is influencing what you click (DuckDuckGo) Measuring Personalization of Web Search (Algorithm Auditing Research Group) Google personalizes search results even when you’re logged out, new study claims (The Verge) Study Revives Debate About Google's Role in Filter Bubbles (Wired) Google ‘incognito’ search results still vary from person to person, DDG study finds (TechCrunch)

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章