首页 > 业界 > 内容

互联网的尽头就是贴标签这届网友开始用爬虫互相贴标签了

发布时间:2022-09-22 16:44:00   来源:网络   阅读量:2132
字号:
互联网的尽头就是贴标签这届网友开始用爬虫互相贴标签了

10天前,一个开发者在论坛网站Greasefork上做了一个ldquo,为C端用户提供扩展脚本。原神玩家指标rdquo。根据开发者留下的公开信息,这个扩展脚本主要用于哔哩哔哩视频的评论区。安装了该工具的用户可以识别发言的网友是否为原神玩家。

来源:网站截图

鉴别方法也很简单。资料片剧本筛选后,符合条件的网友会在头像和昵称后面标注ldquo原神玩家rdquo几句话。

来源:哔哩哔哩评论区截图

这个资料片脚本一经发布,就引起了游戏玩家的强烈反响。在一个比较小的用户脚本论坛Greasefork,原神玩家指标已经安装了上万次。在反馈中,很多用户称之为ldquo今年最佳剧本rdquo、ldquo这个伟大的发明仅次于第一定律rdquo、ldquo寥寥数语就能带来极致的精神享受rdquo。

不仅如此,因为开发者说自己在玩,不太会迭代更新,但是确实有用户在使用中发现了一些bug,所以论坛上涌现出了很多愿意参与其中的开发者,有人做了ldquo原神玩家指标升级rdquo,有的发明了适合哔哩哔哩、微博、知乎的全平台版本脚本,有的则覆盖了王者荣耀、明日方舟、新三相原力等热门游戏,支持更多游戏玩家的识别。

在使用扩展脚本的用户界面中,每个网友的昵称都被贴上了五颜六色的标签,指示器也会根据不同标签的组数显示ldquo普通rdquo、ldquoRdquo、ldquo史诗rdquo、ldquo隐藏rdquo相等前缀。

指标检测不到任何标签的用户会被标记为ldquo平凡|贤惠rdquo。

来源:指标升级版给网友标上了五颜六色的标签。

这个游戏是从游戏圈的ldquo开始的;Rdquo生产竞赛还没有结束。

针对用户在其他领域的识别需求,越来越多类型的指标出现在扩展脚本的论坛上,包括识别虚拟主播的V圈指标、明星粉丝的饭圈指标、苹果/华为用户的指标、抽奖转发参与者hellip的指标;hellip..

匿名开发人员很快开发出了具有更广泛应用的扩展脚本。在一个叫ldquo的地方;组件指示器rdquo在脚本中,用户可以通过定义自己的关键字来识别不同的网络组。换句话说,这个ldquoRdquo是可以由用户单独使用的ldquo给用户一个标签机rdquo。

从技术角度来看,指示器的制造并不复杂。

它主要利用爬虫技术读取社交平台的API数据,通过挖掘评论区和用户发布的动态内容,按照一定的匹配规则进行筛选。这种爬虫技术最早应用于互联网搜索引擎,近年来被大数据公司用来获取用户的个人信息和简历。一些公司对它的滥用,也助长了互联网金融借贷的导流、获客、暴力催收等行业乱象。

随着AI技术的发展,许多互联网平台都开启了智能反爬虫功能,以保护用户的隐私。但对于社交媒体平台来说,用户发布的新闻、评论、转发的赞,以及头像、昵称等公共信息,仍然可以通过爬虫软件轻松获取。

一方面,扩展脚本的技术实现成本和用户获取成本无限低;另一方面,互联网世界的碎片化在增加,所以爬虫ldquo除掉rdquo商业目的的枷锁,爬到了成千上万网友的手上。

在ldquo圈的第一把火中;原神玩家指标rdquo在扩展后的剧本评论区,聚集了很多对原神游戏及其玩家有负面情绪的用户,在很多用户间的互动对话中,他们也开始基于自己喜欢的游戏立场进行自我对齐。

来源:油腻叉论坛截图

总的来说,这种ldquoLine rdquo关于游戏本身的内容不多,更多的是以游戏为标签,对社交媒体上陌生网友的聚类分类。其实很多用户需要ldquo用户指示器rdquo究其原因,是希望为陌生网友在社交媒体上发表了与自己观点相左的内容,谈了自己不喜欢的东西,或者就某个问题发生了争执,找到一个标签式的合理解释。

在用指标给网民贴标签的人中,有相当一部分用户的诉求是mdashmdash阻止不想要的标签内容和社交帐户。

ldquo谢谢,我真的很需要这个,如果能屏蔽掉这个群体的发言就更好了。rdquo

ldquo可以改成屏蔽id和内容吗?我不在乎是不是,但我就是不想看。rdquo

ldquo需要一键黑功能,如果能自动屏蔽就更好了。rdquo

而能成功实现这种诉求的资料片剧本也是很快就做出来的。

事实上,在如今的头部社交媒体平台上,屏蔽和黑掉早已成为必备功能。以微博为例,仅在拉黑上就调整了几次,包括首页是否可见,谁可以发帖,谁可以参与评论。用户有相对细分的选择权。即使是零互动的陌生人发的内容,微博也设置了屏蔽关键词的功能。

但似乎这些以防止网络暴力为目的而推出的功能对于很多用户来说还不够。

很多使用过此类指标的用户发帖称,追溯过去不习惯的网友的发言内容,意外发现这些网友被贴上了某种标签。

来源:某网友发言截图

也发生了一些有趣的变化。一方面,他们更确定自己对某些观点或内容的厌恶是正确的;另一方面,他们更反感某些被贴标签的群体。

而很多网友显然不满足于仅仅认定ldquo敌人;。

有网友观察到,一些网上的网恋者在哔哩哔哩、微博等社交媒体上开起了ldquo猎巫rdquo行动起来,他们不在乎网友具体发表了什么内容和观点,而是专注于寻找被指标贴上标签的群体,进行无差别攻击。

一个荒谬的例子是,在ldquo原神指标rdquo早期版本因为剧本的不完善,所有网友的帖子都要包含ldquo原创rdquo和ldquo上帝rdquo两个单词都将被指示器标记。所以,有些地方叫ldquo还原神舟飞船rdquo和ldquo传染源难以捉摸;在提问和评论区,明明内容与游戏无关,却有游戏玩家、团员或线上玩家的群体行为。

当然,也有很多用户认为用指标标注网民只是为了好玩,而随着安装脚本的用户激增,大量发送到社交媒体服务器的数据请求很可能已经引起了平台方的注意。对于爬虫技术的滥用,开发者面临被平台方起诉的风险,用户的账号可能会被封禁。

来源:哔哩哔哩的标记视频屏蔽脚本/截图

看着这类指标的火爆,很容易让人再一次相信,这几年互联网对人们思维最大的改造就是标签化。移动互联网时代,无论平台是短视频、资讯、外卖、旅游还是电商购物,只要有用户账号存在的地方,平台系统就通过标签化的方式对用户进行分类,然后通过算法推荐偏好的内容或服务。

现在看来,网友们也开始用同样的方式对待彼此了。

支持0个人

反对

商品价值评分

快科技1997-2022版权所有。

ICP编号18024899 -2王编号41010502003949