刚开始接触广告推荐系统,对理论知识还处在一个学习的阶段,看一些资料,这里主要是对看的一些知识点的总结和进一步理解:
http://blog.csdn.net/mytestmy/article/details/18987247
广告生态系统:
这一系列中的博客主要介绍广告系统的生态环境,和广告推荐的流程
主要描述广告业的发展,目前主要是将用户的需求进行统一在
DSP(demand side paltform互联网里有成千上万的广告主)中,
互联网里也有成千上万拥有丰富媒体资源和用户流量的网站,他们急需把庞大的流量变现来发展壮大,同时还希望每一个流量都能够达到最大的收益,也就是途中的SSP(supply
side platform),中间是通过一个ADE(ad exchage)用于需方和卖方之间的广告交易。在交易过程中利用RTB(realt
ime bid)实时竞价,谁的bid比较高,那么这个pv就归谁所有。
在大数据发展的今天,肯定在ADE这一层有很大的发展,才会有人愿意为一个pv进行竞价:
互联网数据平台DMP(data management platfrom)有了DMP,Ad
Exchange就可以知道访问广告位的用户是对什么感兴趣了用户了,这样RTB模式就有了运营的资本,广告主也乐于出较高的价钱来买这个用户。
当一个用户开始访问一个有媒体资源的网站时,首先通过识别用户的cookie分析用户的喜好,这里假设用户是汽车爱好者,然后在SSP中根据用户信息和广告信息进行匹配,将匹配的信息发送到DSP,由商家进行竞价这个PV。
下图是广告技术的生态以及DMP所处位置。
下面可以看看淘宝共享的一个DMP为核心的广告生态圈。
一个和淘宝相关的ppt
http://www.docin.com/p-684358746.html
首先是在M-DSP中综合广告主和用户的信息进行数据标签化管理,发送给发布渠道,根据广告主的投放,和用户的信息进行展示,已经展示后的情况进行结算。
Ad Exchange更容易获得高质量的广告位资源。如下图所示。
优势很明显,就是根据不同人的喜好,推送对应的广告。让广告的转换率最大。
CTR简单基础:
在介绍了广告生态系统之后主要是广告主为什么要购买这个PV,那么必定是给用户展示了这个商品后用户点击的可能性很大那么也就是CTR:
点击率的预估,做的工作可以用下面的图来描述。
http://blog.csdn.net/mytestmy/article/details/18987881
预估一个人点击一个广告的概率
一次广告的展示是否被点击(每次展示被点击的概率可能不一样)是一个伯努利试验,对多个用户展示多个广告的过程是一个伯努利过程,总体的历史展示与点击数据符合一个伯努利分布,伯努利试验成功的概率就是上面的f(user,ad)的值。拟合这个伯努利分布的过程就是训练的过程。拟合分布往往用的是极大似然估计的方式去拟合,刚好做的事情就是跟做一个回归问题是一样的,这个回归叫做logistic回归。
其中y=1表示这个展示被点击了,y=0表示这个展示没有被点击。似然函数和对数似然函数也可以写成下面的形式
这里的h函数就是用逻辑回归进行预测。求上面的式子的最大值,就可以得到w的最优解,这个最优解w就表示当前展示数据的伯努利分布是拟合的最好的,用来预估ctr也是最好的。
在后面讲进一步介绍逻辑回归相关内容