-
清华大学教授:国产电商反刷单系统 比AlphaGo提高25%
关键字: 淘宝刷单限制水权交易淘宝刷单百度广告机制滴滴快车滴滴拼车从理论上看,这和刚才我说的那个房屋买卖的双边市场是相通的。不同的是,这里有一堆卖家买家,而且这里面有一个非常核心的限制,从算法上是非常难解决的——交易的数量,要么是零,要么要大于一定的吨数,比如说我现在两个村进行交易,我们不能只交易两吨,我们要么不交易,要么大于50吨,因为一个交易有非常高的管理成本和运输成本。
所以有了这个限制之后,之前的那一套经济学的理论都不起作用了,所以我们需要重新算一个最大化匹配,这个在算法上都是比较难解决的。我们一系列的工作也是围绕这个新问题展开,彻底解决了算法上和经济学性质的问题。
现在我们算法的简单版本在甘肃省西营灌区使用。据当地初步调查显示,交易量、成交量都有显著上升,最大一个特征是村民更加愿意去做这个水权交易,因为价格设置得更加合理。这就是AI+经济学在民生中的一个应用。现在这个项目我们是跟清华水利系一起做的。最近也有一个草案,力争推动实现全国范围的水权交易。
这是第一个工作,相对学术,并且是服务于社会的,接下来说两个资本驱动的。
高频交易优化淘宝算法限制刷单,系统表现比Alphago高出25%
高频机制(High-frequency mechanism)针对高频场景。有哪些高频的场景?比如说淘宝,每秒钟有成千上万的用户在打开淘宝搜各种商品,这个显然是一个高频,百度的广告拍卖是另一个高频的场景。
在淘宝上设计买家流量分配算法,主要是做什么的呢?比如说淘宝有一个买家,想要买某种物品,在淘宝上搜索,出现了很多卖家,你可能会想,这个不是买家自己愿意点谁就点谁吗?
不是,淘宝提供一个商家排名,这是淘宝控制的,我愿意把这个卖家排在第一,把那个排在第二。排在第一和第二,就在非常大的程度上决定了买家会点谁,他不可能会点第10页的卖家。可能每秒有一万人次的买家访问,在做这个排名的同时,也就完成了买家流量的分配,把多少买家分配给这个卖家。
在这个场景当中,现在学术界工业界没有一个好的算法去分配流量,现在用的都是一些传统的——纯经济学、或者一些纯AI的算法,纯AI的算法包括推荐算法。这些算法使用之后都不是最优的。大公司像淘宝、百度、脸书,谷歌,每个公司都要大概几百人的团队来优化这些算法参数,每天都在调,调了以后,有时它的收入一下子会上去,不调就会下去,所以必须做这件事情。调参数的价格很贵,人力成本很高,而且不一定有效果,所以需要用人工智能的办法来解决,目前没有智能的办法调参。
我最近提出的强化机制设计(Reinforcement mechanism design),关注怎么样把机器学习、强化学习用在机制设计当中。第一个场景就是电商流量分配,每秒钟有几万个买家来访问淘宝,我怎么样把这些买家分配给这些卖家。现在工业界的做法是,卖家定一个价,根据这些价格设计一个机制和算法,算出来一个排名。这个排名出来以后,卖家在今天结束的时候会看我今天赚了多少钱,然后优化这个定价,这些卖家也会调商品展示,排名第一的可能不会调,排在第二个的卖家可能会降个价,让它的产品有新的排位。
这里有个什么问题呢?传统的算法,淘宝用的算法,叫做推荐算法,没有用到任何经济学的东西,带来了一个非常大的问题叫刷单,刷单分为好几种,其中一种就是卖家反复调它的价,让它的成交量得到提升,有高的成交量之后,会在将来排在最前面。比如这儿有一种龙井茶,一斤才35块钱,这是为了让它的成交量迅速得到提升,当你下个月搜的时候会排在淘宝第一,但是价格已经变了,商家可以赚很多钱。推荐算法是无法意识到这些的,它是通过成交量高进行排名,并没有想到卖家并没有诚实地公布成交量的信息,这是刷单刷出来的。所以这里面有对经济学的刚需,怎么样设置流量分配算法,让这些卖家不要刷单。
媒体曝光淘宝商家刷单(图:视频截图)
之前做了一个纯经济学的算法,淘宝发现非常难用,我们最近和淘宝合作的工作就是AI+经济学的算法。它做的事情就是让淘宝拥有决定权(decision maker),每轮输出一个排名,这些卖家看到这些排名之后,向淘宝反馈一个价格,随后系统则统计双方所获得的利润。随后进入下一轮循环。
这里用了一些非常新的人工智能模型来模拟这些卖家脑子里在想什么。有了这个之后,我们通过了一系列的机制,在淘宝这样的平台上完成自动优化排名系统,这是我们的神经网络的设计。我们的算法效率大概比AlphaGo团队deepmind的算法高了大约25%。
百度的广告定价
接下来就花点时间说一下我们的第三个应用:怎么样在百度上给广告拍卖进行定价。百度很大一部分收入是从广告来的,像脸书也是,谷歌也和百度差不多。所以优化广告收入,对他们来说是最重要的事情。
这也是一个高频机制,比如每秒都有大量的用户搜索“电脑”,百度会在前三位显示三个关于电脑的广告。 首先百度设计一堆广告的机制,然后有了这堆广告的机制和参数之后,这些广告主会看到一些KPI,比如说我今天的广告展现了多少次,有多少次的点击,有多少转化,看到之后会调整广告出价。让它进入第二轮,这跟刚才差不多。这个问题当中,决策人(decision maker)当然就是百度,它需要调的参数是什么?它需要调的参数是所有拍卖的定价,就是所谓的一个保留价,目标是长期利润。
这是我们的一个强化机制设计的一个模型,把机制设计和强化学习结合起来,就是我刚才描述的这一整套过程,当然也用了一堆最新的人工智能的算法,然后去寻找最优的保留价。在学习广告主模型的时候,我们用的是比较经典的RNN模型。
我们对广告主的建模还是学得非常的准确的,直接来看仿真效果,新设计的技术给收益带来一个40%左右的提升。当然这里面有一些水分,我们用的是仿真,广告主的建模是基于我们自己深度学习学出来的模型,线上的时候,会有一些新问题,那个也是我们最近在解决的问题,但是可以说,收益的提升还是很明显的。
郑州市一展会上的百度推广大幅广告牌@视觉中国
滴滴拼车定价
最后,我们现在做的工作是和杉数科技一起给滴滴做的拼车定价,这是非常有意思的工作,我对这个工作特别感兴趣。
大家不知道有没用过拼车,就是打开快车的界面,左边有个叫拼车,非常奇怪,定价是一口价,不管拼没拼成,都是这么多钱,按理说我拼成了我应该付少一点,我没拼成就付多一点,现在是拼没拼成都是18块钱。这就有个问题,滴滴希望乘客拼成,因为能收两倍的钱,如果拼不成滴滴会亏非常多的钱,因为拼车的价格比快车的价钱便宜很多。但是乘客不希望拼车,因为自己坐一辆车多舒服,所以有一个这样的利益冲突。
我们跟杉数合作,提出了一套比较好的算法,就是所谓的“两口价”算法。拼上是一口价,拼不上是另外一个价,这样双方的利益就统一起来,而不是之前的对抗。这个策略制定之后,当然后续会有很多相应的算法去计算最终的价格。所以说利用一些人工智能和经济学一些技术,我们在这两个方面帮助滴滴做了一个非常好的优化,既改善了民生,也提升了一个公司的收益。
今天我要说的就是这么多,谢谢大家。
拼车订单量和占比的时间分布(图:央广网)
- 原标题:清华大学教授:国产电商反刷单系统 比AlphaGo提高25% 本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:张珩
-
李强:大力发展智能网联新能源汽车 评论 31“西方媒体,看清你们了!”拜登“走后门”也没躲过 评论 119“TikTok只是烟雾弹,美情报机构才无时无刻不在…” 评论 150最后通牒?以色列放话“要么签,要么打” 评论 136最新闻 Hot