小心的木马:「女性声优人气榜」背后潜藏着资安危机

导读 文:好宅之人 近日笔者留意到,网路上正流传一个「网站/媒体」举办的女声优Top 10排行榜,吸引了不少声优迷CLS(Comment、Lik

文:好宅之人

近日笔者留意到,网路上正流传一个「网站/媒体」举办的女声优Top 10排行榜,吸引了不少声优迷CLS(Comment、Like、Share)。例如MUSE木棉花的官方Facebook,在转载消息后,吸引到超过4000个回应和400多次分享。

我每年也会推出《宅人调查报告》同人誌,透过问卷调查,研究数百位宅人的喜好和兴趣变化。而「最喜欢的男/女声优」这题目,亦是每年必问,也甚多宅人关注。所以比起「女声优Top10」的排名结果,我更有兴趣知道,这个统计背后的调查方法。

可是当我到网站细看统计方式,却越看越不对劲。这个排行榜看似非常客观和科学化,但说穿了根本是「一本正经地胡说八道」。

一个乱来的统计,杀伤力毕竟有限,最多只会为宅界製造一些纷扰和口水战,很快就过气。但这个排行榜背后,潜藏着资讯安全危机。两者为何会有所关连?在揭秘之前,让我先拆解这个统计的10个奇怪之处吧。

奇怪点1︰捨弃投票方式进行人气评测

这个排行榜的名字是「2020人気女性声优ランキングTop10」,直译就是「2020人气女声优Ranking Top10」,照字面意思,人气越高,排名理应越高。坊间普遍调查方法,都是按读者/观众/网民的投票数字来分高下。

不过在这个统计中,并不设投票程序,改为收集声优在网路、现实的表现数据,进行评分,然后将十个细分加起来,以总分排序。

以数据评测取代传统投票,并非不可以,只要详细交待评分準则就可以了。但问题是,这些项目的评分方法极度儿戏,下文会继续分析。

奇怪点2︰网路表现为何能代表人气?

其中一项评分标準,是「ニコニコ动画投稿数」,花泽香菜的投稿数有8381,得8分。但到底「投稿数」指什么,则没有详细说明。照字面估计,是该声优名字在niconico的搜寻结果。

其他评分标準,包括niconico再生量过100万或50万的影像数量、IG投稿数、YouTube Topic登录数等等。这种评分方式,各平台都有兼顾到,看似合理。但细心一想,不禁产生很多疑问──为何这些数字,能代表声优的人气?

这些数据,除了niconico再生量外,顶多只能反映这声优的名字,在各电子平台出现的频率程度罢了,未必跟人气成正比。例如声优A在某平台比声优B的出现频率高100倍,可能只是某个声优A的Fans疯狂上传关于她的短片,不等于声优A比声优B更人气。

假如将每项搜寻结果的观看数加进去一併考量,或会令数据更为有说服力,否则充其量只能作为「网路人气指标」,用来分析声优整体人气,就有点牵强了。

奇怪点3︰各平台得分数值差距大

每个声优都有10项评测标準,但官方并未公布每项的最低分和满分是多少。我观察到有些声优在某项目拿过10分,也有人是0分,先假设每项的分数範围是0~10分吧。

我在细心比对后,发现声优在不同媒体平台的得分,差异极大。例如Gyao和Instagram两项,头十位声优都只取得零点几至一点几分,但在niconico相关项目,随便也能拿个3、5、7分。而且niconico还要佔十项中的三项,换句话说只要在niconico「表现好」,其他平台的表现,变得毫不重要。

奇怪点4︰莫明奇妙的计算公式

每一项评分的计算方式,都没有公开,无从审视这些标準定得是否合理。但我研究过后,逆推算出某些评分背后,有一条相当简单的公式︰

分数=量度数值/常数(再四捨五入)

在Instagram、YouTube以及CD销量中,常数是1万,至于Yahoo那一项就是100万,niconico投稿数的常数是1000、生放送的常数是100。至于这常数是如何计算出来,就只有统计的负责人才知道了。

这些古怪计算公式,正正解释了上一点提及的问题︰niconico的常数偏低,所以分数偏高。其他平台的常数却用上10000这高数值来计分,例如Top 10声优在Instagram的量度数值都不超过10000,所以在这一项的得分都不超过1分。

假如能将这常数调整一下,各平台的得分就会对等得多了。

奇怪点5︰以搜寻结果来做人气指标

审查标準其中两项,是Yahoo检索结果和Google检索量。但使用这类数字,来判断人物/事件的人气度,很易出现偏差。因为每一个检索结果,到底是否跟keyword有关,要人手逐一点击进去才能判断,很可能100万个结果中,只有头1000个相关,其余99.9%都是无关或重覆的网站。

再加上以名字来搜寻,会对于「日文名=中文名」的声优大为有利,例如「悠木碧」的搜寻结果会包含日、中网站,但搜寻「上坂すみれ」则不会包含「上坂堇」的结果。

若是想知道特定关键字在网路的人气演变(而且想锁定地区),其实更应该使用Google Trends。

奇怪点6︰现实表现的量度範围有长有短

在10个评分準则中,有两项是跟声优的现实表现挂勾,分别是出演TV动画作品数,以及2017年到现在的CD累计销量。

可是统计中并没有说明,为可只选择TV动画,却排除剧场版动画或者游戏方面的配音工作。至于怎样的演出才算数呢?在一套TV动画中配主角、配角跟路人角色,是否都有同等份量?一切也无从得知。

看CD销售量数来判断人气,本身问题不大,但为何只由2017年算起?如果只是想观察近期表现,那么为TV动画配音这一项,应该同样由2017年计起才对啊。

奇怪点7︰公布数据与现实数据不吻合

比起之上提到的种种不合理,我认为这一点问题更大。niconico过100万/50–100万view数的片量最易验证,例如上坂すみれ,50–100万以上的片有9条,有不少都是几年前upload,view数应该不会在短时间内急升,但公布的数据中指只有2条。我又抽样验证过其他数字,发觉有些跟公布数据不太相近。

由于这次统计没有公开调查日期,无法得知是否在较早的年份进行,才导致呈现出来的数据,跟现在看到的不相符。

奇怪点8︰古怪的日文文法

每个上榜声优,都会附以一段介绍文字,可以见到渗入不少作者的个人观感。而语法上则十分正经、客气,经常在语尾使用です和ます,很有教科书的感觉。例如「佐仓绫音はとても面白い人です」、茅野爱衣的描述是「见た目は可爱い、声も可爱い声优です」。即使我不是日文专家,也察觉到文法上十分生硬。

但最大问题,是内文间中会出现一些我从未见过的古怪日文写法,例如全篇文章以「要约︰」二字开头;在介绍悠木碧时,劈头第一句便是「真・合法ロリです」,内文还有「たくさんの课金行为をやります」,有种从中文直译的感觉。

在Google检索量一项,那里的日文写着「グーグル検索ボリュウーム」,当中的ボリュウーム应是指Volume,可是正确的日文写法应该是「ボリューム」才对,这里多了一个ウ字,很难想像人会犯这种低级错误。

原来这篇文章,并非以公司或机构名义发出,因为在文章开头,竟写着投稿者的名字︰liushuang,一看就知道是普通话的拼音。种种证据都指向一件事──文章的写手似乎并非人。

为什么一个网站,会找不太懂日文的人来出官方文章?看下去就能明白了。

奇怪点9︰明明是网站,却用了cn域名

相信熟悉IT的人都会发现到,这个日文网站最奇怪的地方,是其网域用了代表的cn,而非一般公司会用的jp,代表这网站很可能沿自,只是披了个外语的皮。在网页最下面的语言选项中,只有日文、英文、法文、德文,还有繁体中文,就是不见简体中文。

于是我就Google一下这网页的名字DVDfab,竟在百度百科(!)找到相关记载。DVDfab原来是由Fengtao Software.Inc(北京世纪高蓝科技有限公司)所推出的产品。

真相大白!原来这网站背后是由公司操控,只是中资背景都被巧妙地隐藏起来了。不知情的人进去这网站,看到日文介面,根本不会联想到背后跟有关。

奇怪点10︰网站本身是科技软体公司

「北京世纪高蓝科技」这间软体公司,专门製作下载YouTube影片、抽取DVD/Bluray内容等影音编辑软体。一些御宅族,尤其是声优控,都会有储存声优片段的习惯,自然有很大机会需要用到这些软体。也难怪这公司会在官网发布一些跟声优相关的文章,再在文章中插入自家品牌的广告了。

所以这网站本身就不是处理开文化相关情报,文章作者只留下名字,资历不详,统计报告的可信性就更成疑。

排行榜衍生的资安问题

我在逛这个网站时,发现除了这个女声优人气榜,还有很多不同的排行,包括最有趣声优、最帅声优、最可爱声优等等。这些软性资讯,容易吸引到声优爱好者进入网站,然后不自觉被插在文章间的广告吸引,下载并使用,却不知道这些软体,原来都是源自。

最近很多推出的软体,都被质疑置入了后门程式,严重威胁使用者的网路隐私,受到国际关注。例如早前捲入抄袭风波的游戏《原神》,就被揭发其防盗版程式,会常驻在电脑之内,即使关闭甚至移除游戏,该程式都不会消失,引起公众恐慌。另外在跟Twitter联动时,游戏要求的权限过多,被质疑会导致玩家社交帐户资料外洩。

假如明知是推出的软体,只要不去下载就好,但是刻意伪装成外国公司的网站,要提防就变得相当困难了。所以日后就算遇到一些「日文」网站,也不要胡乱下载网站提供的软体,最好先小心求证,查清楚公司背景,那就能继续安心上网了。

本文经好宅之人授权转载,原文刊载于此

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章