TikTok为何让你上瘾?揭秘背后的推荐算法

“ TikTok中的5分钟等于现实生活中的1小时”。

这款海外版「抖音」正在让更多用户“上瘾”。

不到两年的时间里,TikTok迅速发展为2020年月活将近8亿用户的病毒式App。同时,也占据了用户大部分空闲时间的注意力。

根据调查数据显示,人们平均每天在TikTok上花费52分钟,而在Snapchat、Instagram、Facebook则分别为26分钟、29分钟、37分钟。

它为什么能让你不知不觉的浪费掉时间?

“以用户为中心”是TikTok设计推荐系统原型的核心。换句话说,就是你爱看什么,它就推荐什么。

想象一下,打开App,随便刷几个视频,动动手指就可以获得个性化的内容,下一条视频永远是自己爱看的。你怎么会忍住停下来?

在推荐机制中,如果你最开始点击了跳舞视频,那么你的个性化内容最初就定位在娱乐领域,后续机制将继续跟踪你的行为进一步分析,最终仅推荐给你更为精准的内容。

(3个主要组件—制图:Catherine Wang)

由于TikTok从未公开过核心算法,所以以下皆为我根据公开的资料等信息做出的推断性结论,并不代表其真实的推荐流程。

推荐工作流程-制图:Catherine Wang

步骤0:用于用户原创内容(UGC)的Duo-Audit系统

在TikTok,每天有数百万用户上传内容。如果单靠机器审核,很容易让一些含有恶意的内容钻空子。但纯手动审核也并不现实。

因此,双重审核成为TikTok筛选视频内容的主要算法。

机器审核:一般来说,Duo-audit模型(基于计算机视觉)可以识别用户的视频图像和关键字。

它主要具有两个主要功能:

1)检查剪辑的视频中是否存在违规内容并检查文案。如果怀疑违反,内容将被模型拦截并标记为黄色或红色,以供人工审查。

2)通过从视频中提取图片和关键帧,TikTok的双重核查算法将使提取的内容与其庞大的存档内容库相匹配。如果有类似内容,则会降低所分配的流量以及推荐权重。

手动审核: 主要关注3个区域:视频标题,封面缩略图和视频关键帧。

对于通过Duo-Audit模型标记为可疑的内容,技术人员将对其进行手动检查。如果确定违规,该视频将会进行删除、降权、封号等处理。

步骤1:冷启动

TikTok推荐机制的核心是信息流漏斗。当内容通过双重审核后,它将被放入冷启动(初始)流量池中。例如,你制作的新视频通过审核之后,TikTok会分配200-300个活跃用户的初始流量,如果人群较为精准,用户互动效果不错的话,就可以获得多达几千次的展示。

在这种机制下,新创作者可以与社交影响者(可能有成千上万的追随者)竞争,因为他们的起点相同。

步骤2:基于指标的权重

通过初始流量池后,视频可以获得数千次观看,而这些数据将被收集和分析。分析过程中考虑的指标包括喜欢,观看,完整观看,评论,关注者,转发,分享等。

然后,推荐引擎将根据这些初始指标和你的帐户得分(无论你是否是高素质的创作者)来衡量内容。

如果引擎决定对你的内容加大权重,则前10%的内容将带来10,000-100,000的额外流量曝光。

步骤3:用户偏好放大器

来自步骤2流量池的反馈将进一步被分析,来决定是否使用用户偏好放大器。在此步骤中,比较优质的内容将在特定的用户组(例如,体育迷,时尚爱好者)中得到大范围推广曝光。

这类似于“猜测您喜欢什么”功能的概念。推荐引擎将建立用户个人资料库,以便它可以在内容和用户组之间找到最佳匹配。

步骤4:热门趋势

不到1%的内容能最终进入热门趋势这个流量池。内容在其中获得的曝光量要高于比其他的流量池。因为这类内容将被无差别地推荐给所有用户。(举个例子,无论你是谁,你可能都想观看有关“黑人生命至关重要”的最新抗议者视频)

其他步骤:延迟曝光

一些TikTok的用户可能会注意到这样一种情况,自己的某个视频作品在发布数周后,其内容突然获得了较大的流量曝光。

主要有两个原因:

首先,TikTok拥有一种算法(昵称“ gravedigger”),可以回顾旧内容并挖掘出高质量的曝光对象。如果你的内容已通过此算法选择,则表明你的帐户有足够的垂直视频来获得清晰的标签。此标签将增加在gravedigger中的内容可见性。

第二,“趋势效应”。这意味着,如果你发布的其中一个视频内容获得了数百万的观看次数,这将把访问量引向你的主页,从而增加以往所发布的旧内容的浏览量。通常垂直领域的创作者会遇到这样的情况(例如,逗猫视频创作者),由一个热门视频带火其他所有高质量的视频(人们希望看到更多可爱、有意思的逗猫视频)。

局限性:流量高峰

如果一个内容通过信息流漏斗(双重审核,权重迭代和放大),则创建者的帐户将获得较多的曝光,点赞留言等互动以及一定数量的粉丝。

但是,根据研究,这种高曝光的时间有限。通常将持续一周左右。在此时间段之后,内容和帐户将热度降低,甚至随后的视频也很难获得大范围的曝光。

为什么?

主要原因是TikTok希望在其平台上发布的视频种类多样,尽可能做到公平的创作环境,所以消除其算法中的意外偏差。通过这种设计,推荐引擎将不会偏向于特定类型的内容,以确保新内容将有平等的机会成为下一个爆款。

内容节选翻译自:

https://towardsdatascience.com/why-tiktok-made-its-user-so-obsessive-the-ai-algorithm-that-got-you-hooked-7895bb1ab423,内容有所删减及修改​

发表评论

邮箱地址不会被公开。 必填项已用*标注