文章发出后,在网络引发关注。“点评造假”是否只是个别现象?通过调查,记者发现,旅游网站之间点评雷同的现象并不少见,“点评搬运”或成旅游网站“潜规则”。
22日,蚂蜂窝网络科技有限公司回应承认部分点评造假,已对涉嫌虚假点前世死因评的账号进行清理,并表示针对文章中事实的言论,和已被查证的有组织行为,马蜂窝将采取法律手段自身权益,并于22日晚间起诉爆料公司深圳乎睿数据有限公司名誉侵权。
乎睿数据在发布的报告中,其以“一字不落”才算抄袭的标准,现了7454个抄袭账号,这些账号合计抄袭了携程、艺龙、美团等竞品网站572万条餐饮点评,1221万条酒店点评,占到官网声称的总点评数的85%,并提出了多个点评账号出现身份矛盾、时间错位、翻译错误等现象。
记者梳理发现,这并非点评和旅游网站首次被爆出类似事件。今年7月,小红书App就曾在微博发布消息称,大量用户向其反映大众点评疑冒用小红书用户名称账号,批量建立虚假账号,抄袭及搬运用户在小红书发布的原创笔记。
而据相关报道,旅游网站携程与“去哪儿”同样发生过“点评数据之争”。2008年,因“去哪儿”网站中有数万个页面转载有携程酒店点评文章,携程将“去哪儿”告上法庭。最终经法院审理确认,携程拥有该网站内容及资源的版权,“去哪儿”行为属于侵权。
按照乎睿数据的说法,马蜂窝若抄袭了1800万条点评,如此量级的数据远力所能完成,有业内人士表示,该行为或是利用爬虫软件完成。
所谓爬虫软件,是指按照一定规则,自动抓取互联网信息的程序或者脚本。该人士表示,利用爬虫软件,抓取其他网站数据,再搬运到自身平台,这在互联网行业并非新鲜事。
事实果真如此?爬虫软件抓取数据难度有多大?记者随机选取了一家酒店,利用爬虫软件,不到两分钟便抓取了其在携程和同程旅游网站中的百余条点评内容。通过比对两份数据,记者发现,该酒店在两个网站中存在13条完全雷同的点评,而且多数点评在两个网站所显示的日期完全相同。
其他平台是否也存在此类现象?记者进一步检索该酒店在其他平台的点评数据,发现驴妈妈、马蜂窝等旅游网站中,点评雷同的现象同样存在。其中一条103字的点评内容在同一天内分别出现在了携程、同程旅游和驴妈妈网站上——这意味着有消费者在一天内通过三个平台订了同一家酒店,并发表完全相同的点评,显然并不合理。记者发现,该酒店在驴妈妈上一共有5条点评,均能在其他平台的点评中找到完全相同的“孪生兄弟”。
“点评搬运”是网站行为还是个别酒店的行为?对此,记者又随机抓取了上海两家排名较靠前的酒店在不同平台的点评数据,发现或多或少均存在雷同的点评,这些点评中,既有相对简单的好评,也有长篇和差评,部分点评账户连名称都是“搬运”而来。值得一提的是,记者在比对数据中将“一字不差”作为判定雷同的标准,许多在搬运后由人工进行“洗稿”的点评并未反映在内。
一名旅游自从业者告诉记者,作为“非刚需”的行业,旅游网站的流量往往受季节影响。而对于普通人而言,如果不是想给差评,往往不会特地上网站进行点评,这也造成许多中小旅游网站缺乏人气的现状,某种程度上也催生了“搬运点评”的需求。
对于此次“数据造假”的风波,马蜂窝与乎睿数据的争执依然未有,具体将有待双方开庭时公布。
但在业内人士看来,互联网行业的“数据注水”似乎并不意外,特别是中小网站,主要靠的就是“流量+广告”实现内容变现。马蜂窝曾在上一次融资时表示,每月有1亿活跃用户,其中85%来自其移动应用程序。网站用户每月发布超过13.5万篇旅游文章,当时预计2017年个人旅游产品的销售额将超过90亿元人民币(合13亿美元)。
法律专家蔡湘南表示,如果“数据造假”的行为被坐实,平台方可能涉嫌侵权以及不正当竞争。而从公司角度来看,如果平台提供了虚假的数据,导致投资公司因为其虚假数据,做出错误判断,对其进行投资,可能在民事上涉嫌“欺诈”,有可能导致其投资合同“撤销”,其自身运营发展也将受到很大影响。
尽管“数据造假”受到业内外普遍诟病,但是如何根治数据造假,从体制机制上建立有效的防范纠错和应对处置机制,依然任重道远。
“数据造假行为的治理应该是一个多主体、多元化、综合规制的过程。” 中国互联网协会研究中心秘书长吴沈括认为,首先应该明确各个主体的权责,鼓励各方积极承担相关责任,比如立法部门应尽快填补法律在这一方面规制的空白。其次,执法部门也应当革新监管方式,加大处罚力度,可采取设立“”、违规主体等形式,为行业的发展划定一条原则红线。