亚马逊我用的不多,我只说一下淘宝和豆瓣网云。要讨论淘宝为什么做不好推荐,先从成功的推荐系统说起。
豆瓣和网易云音乐都有一个列表的功能,豆瓣里叫豆列,网云里叫歌单。大量的用户把相似的音乐,豆瓣页面放置到一个列表里。一个豆列/歌单的关注度,说明了这个列表的成功度。一个列表的成功度,同时也说明了列表中不同元素之间的相关性。豆瓣/网云中大量用户正在不断地创建,分享,使用豆列和歌单。这些数据足够用来产生推荐。
说的简单点:
你在网云上听了一首音乐,然后网云分析这首音乐,发现有一千个歌单中包含了这首音乐。然而,这一千个歌单中有九百个歌单包含了另几首,所以,网云便把这几首音乐推荐给了你。这一千个歌单中绝大多数都是冷门的,但总有几个歌单十分成功,关注用户量大,听的次数多。
所以还有一个权重:关注度越大,创建者的关注度越大,歌曲听的次数越多,这个歌单的权重越大。
你会发现,几乎所有成功推荐系统都使用了列表:网云用的是歌单;豆瓣FM使用的是音乐人创建的赫兹;豆瓣电影丶图书使用的是豆列。但豆列只是豆瓣app之后豆瓣才开始猛推的。
在此之前,豆瓣的推荐数据从哪来?
兴趣。
豆瓣是一个主打兴趣的社区。一部电影,你给了5分。豆瓣发现有另外的一千人也给它5分,这一千人的其他高分推荐便可以哪来参考。反过来,你给了一部电影很低的分,其他同样给它低分的用户,他们推荐的电影就可以供你参考。
于是,你所有给高分的电影,组成了一个列表,列表名就是你,推荐问题又能用1来解答。绝大多数社区推荐都只是这样子就可以了。
然而有一个问题:一个人的兴趣可能是广泛的,可能同时喜欢动画电影,又喜欢好莱坞。把这些电影放在一个列表里并不适合。所以豆瓣这几年开始猛推豆列,网云才会成功,他们只做了一件事,让你主动的把自己不同的兴趣分开到不同列表里。一个小小的举动能把推荐算法的精度提高若干数量级。
可淘宝却不行,淘宝数据虽然庞大,但大多不是用户主动分享的,一方面涉及用户隐私,另一方面,淘宝的公共数据可用来做推荐分析的信息并不多(但也是有的,比如单个店铺里的各种商品组合)。淘宝说,怪我喽。
Q:@张三峰 可是淘宝不能通过口味相似的购买进行推荐嘛?比如我曾经购买过商品a。购买过商品A的用户最常购买的商品有哪些,然后推荐给我。
A:然而,淘宝推荐的是"浏览过本商品的人同时也浏览过的其他商品",而不是"购买了本商品的人同时也购买过的其他商品"。这正是提问者和很多网民吐槽的。反正我很难理解马云为什么会这样做。如果非要理解,可以这样解释:
淘宝的推荐是在你访问了一个商品后立刻就产生的,而不是购买了商品后才产生。淘宝和亚马逊的区别在于,淘宝的同款商品数量太大,亚马逊如果看中了一款商品,可以立刻购买。而淘宝即便你看中了一款商品,你也要大量对比不同店家的同款商品。
结果就是,淘宝用户大多数时候处于购买前(也就是『逛而不买』)的状态,亚马逊用户大多处于购买后的状态(相对淘宝)。所以淘宝推荐同样的产品,亚马逊推荐相关的其他商品。淘宝如果按购买后才推荐的方式,不仅会造成马太效应泛滥,而且会降低用户『逛』淘宝的体验。
然而,你经过一整天的寻找,终于成功买下了你需要的『迷你吸尘器』。在此之前,淘宝的推荐对你十分有用。当你成功购买后,你又希望淘宝给你推荐其他相关产品。如果淘宝应你的愿立刻改变了推荐方法,将推荐从『同类商品』更换为『相关商品』,这里就会有一个隐患:隐私泄露隐患。
你是否『已经』购买了『迷你吸尘器』是一个隐私。因为淘宝并非只在淘宝站内给你做针对性广告,它还会通过合作网站的方式在所有合作网站上给你做针对性广告。也就是所谓的阿里妈妈。有心人就可以分析前后的淘宝给你推送的广告,来判断你是否『已经』购买了某件商品(这里不谈理论上实现的难易)。
另外一方面,淘宝无法保证自己的商品卖出去是有质量保证的,你今天买了个迷你吸尘器,买之前你希望淘宝给你推荐『相似商品』,买之后你希望淘宝给你推荐『相关产品』,可明天你收到东西发现不满意于是就退货了,你又希望重新买一个,希望淘宝给你推荐『相似产品』。淘宝说,我好崩溃啊。所以干脆,直接给所有人都推荐『相似产品』吧。
当然,我并不是马云,我不可能知道马云是怎么想的,这里只做一个简单的推理,也有可能又是阿里的一个[支付婊]呢。
红姐心声:
看到这些技术大牛的分享,红姐顿时觉得『世界这么大,我想出去看看』。一个人的知识储备可以不够富足,但你可以依靠身边的朋友或者网络资源来进行补给。当然,红姐的公众号正是因此而生。
在建立之初,个人的目标是做成读书笔记用来丰富自身的淘宝运营经验,但随着时间的推进,已经改变了这一单纯的想法。单一的淘宝知识似乎已经无法满足这几万粉丝的胃口,因此我又增加了营销案例丶创意丶数据分析等模块,希望我的日常整理,能够给大家带来实际的工作帮助。