129套的立体风控系统,基本上覆盖了我们所有的操作路径。我拿几个来举例说明一下:
比如说“NLP文本挖掘模型”他可以做什么呢?你刷单的时候,是否需要给刷手关键词,而刷手又是如何来搜索关键词的呢?是不是需要复制你的关键词,然后到淘宝的搜索框下面去复制粘贴,然后点击搜索,那么这个搜索的路径是符合正常买家的购物行为的吗?不符合!因为正常的买家都是自己敲键盘,输入核心关键词然后点击相对应的长尾词进行搜索购物的。那你的刷单粉丝的操作就会被系统记录为异常值。
我们在来看:用户的行为时序模型。一般大家在做补单的时候,都会要求刷单粉丝做标签,做货比浏览。那么问题来了,如果说你的成交的订单,都是沿用一个统一的购物轨迹,你觉得这是符合算法逻辑的吗?在正常的买家购物过程中,有一部分用户是会添加购物车货比在下单购买,还有一部分用户是会直接下单购买。现在绝大部分的用户都是在物流确认收货以后,由系统默认收货的,而你的订单可能都是在物流签收以后当天确认收货给出评价的。这些有悖于整个类目下所有其他同行的异常行为就会被系统记录在案。
下面我们可以看到:DF地利风险聚集模型,DEEPGraph模型,图传播模型等等,这些模型都是按照同样的逻辑来记录我们的单品在操作的时候,是否存在异常的数据点。到最后系统会汇集起来我们的单品一共存在的异常数据点的个数,比如说你的单品数据异常维度有20个,这样的单品是否会被抓出来,给到你的单品降权或者扣分处罚呢?这很难确定。但是背后的逻辑是什么?这很重要,这是我们操作单品躲避稽查的核心思维:赛马!
“赛马”很熟悉,平台很多的算法都是围绕赛马来的,聚划算,淘抢购,双十一,双十二等等,同样的刷单稽查也是一样的。我们之前已经说了再平台里面可能有超过80%的商家都会存在刷单作弊的行为,那么总不能把所有商家都抓出来吧?这样平台也就毁掉了,所以平台也会考虑我大概要控制到什么样程度。我们假设现在平常需要抓10%的作弊商家,那么这个时候就要看你这个20个异常数据,会排在所有作弊商家中的位置,如果按照10%的尺寸来算,违规异常数在30以上的商家,被降权处理,那么你的链接会比较幸运的躲过这次稽查,但是如果10%的尺度下来,15个以上的异常数据点就会被判定为刷单作弊,那么这个时候很不幸,你就会成为被抓出来做处罚的对象。那要躲避掉系统的稽查,你唯一需要做的就是尽可能多的避免出现异常数据点。在这个过程中你实际上是跟同行在做赛马的竞争,只是这个时候我们比的不是越多越好,而是越少越好。