今日头条推荐机制比较复杂,涉及阅读转化率、阅读进度、跳出率、阅读速度、互动率等方面。
我们先来看看头条号大致的推荐流程:
第一步:消重。
消重有两方面:一是文章相似,二是主题相似。
头条号在处理时,以是否有版权、原创标识、体验好坏、发布时间作为准判断原创的标准,因此,有版权、原创标识的、发布早和体验好的会被认为是原创,反之为伪原创或者转载,甚至抄袭。
出现相似主题,头条号为了提高用户体验度,它会让用户只看到该主题中的一篇,以防重复。
第二步:审核。
消重完成后,您的文章进入审核阶段。
头条号首先会拦截不适合推荐的内容,如黄赌毒、反动、低质、旧闻。其次,限制文章的推送范围,如头条号的领域是地区北京,那么就会限制其他地区而只推荐给北京的用户,另外标题党、低俗、软文黑稿也会受到相应的限制。
第三步:特征识别。
文章被审核通过后,就会进行特征识别。
它会根据标题、内容等进行识别是娱乐、汽车还是体育等;如果识别为体育,那么是足球、篮球还是乒乓球等;如果识别为篮球,那么是中国篮球还是NBA等。如此一级一级,一共分成四级,头条号根据这些分级和实体词推荐给符合这些条件的人。
第四步:系统推荐。
特征识别完之后就会推荐给用户。
头条号的推荐不是一步到位的,因为它不知道文章内容的好坏。所以它会试探性的推荐给最可能感兴趣的用户,如订阅者、兴趣点相同和相似的人群,根据他们的反馈进行下一步的调整,这个过程被称为冷启动。如果该文章有点击率高、阅读深度大(阅读完成率)、阅读广度及深度高、收藏转载高以及评价正面等等一系列的正反馈,头条号就会加大该文章的推荐;相反,如果上面这些都很少又是负面,外加用户举报投诉等,就会相应的限制推荐。
第五步:人工干预。
头条号为了提高用户体验度和作者满意度,会根据推荐过程的反馈进行干预。在满足用户的前提下,尽可能的发掘具有潜力的作者,让有能力的作者留住就会增加其阅读和收入,而那些劣质的、抄袭的、打广告的就会限制、删除、禁言,直至删除。
下面我们来重点谈谈第四步:系统推荐。在这一步里,头条号的推荐机制是比较复杂的。
这个问题其实就是:头条号如何评判一篇好文章?
头条号给出了推荐量、阅读量、评论量、收藏量、转发量、阅读进度、跳出率、阅读速度等方面的数据,我将评论量、收藏量、转发量合并计算,称为互动率。按照每组数据的平均值作为标准,筛选出推荐量前20的文章进行重点分析。(下图中标黄部分为低于平均值的数据)
通过颜色对比可以看出,在这几项数据中,互动率不达标的数据最多, 因此我认为互动率与推荐量的关系最低,而阅读率、阅读进度、跳出率、阅读速度等4项指标与推荐量的关系最大。
我们都知道,头条号是通过机器算法评判文章质量的优劣,好文章推荐给更多用户,差文章只能胎死腹中。通过分析发现,原本我认为的转发、收藏、评论并不是头条判断一篇文章优劣的关键标准,为什么呢?
其实我也不知道,我猜测大概是为了防止刷数据吧,毕竟转发、收藏这些数据是可以造假的,而其他数据只能由被推荐用户的行为获得反馈。