DSP

广告面试题之CTR

2019-07-13 15:30发布

class="markdown_views prism-atom-one-light"> 摘自七月在线习题库

介绍CTR原理

CTR在竞价广告系统中起神马作用?
CTR(Click-Through-Rate)为点击率,它是互联网广告中最基本的概念,我们先来看看点击率对于一个竞价广告系统而言意味着神马?
我们先来做一道简单的题目——阿迪和耐克作为广告主来竞价,阿迪出2块钱一个点击,耐克出1块钱一个点击,假如微信广告平台有100次曝光,它应该给谁?阿迪还是耐克?有人说,当然是给阿迪啊,它出的价钱高。
在这里插入图片描述
这个答案是不对的,如果阿迪的点击率为1%,耐克的点击率为5%,那么给阿迪能产生1个点击,每个点击1块钱,微信能赚2块;给耐克则产生5个点击,每个点击1块,微信能赚5块,广告平台不傻,当然要给耐克! 好,从这个简单的案例中,我们可以看出几点: ①广告平台关心自己的流量价值——即自己的流量曝光卖的贵还是便宜,一般用ECPM(earning cost per mille)这个指标来衡量,即每1000次曝光带来收入。
②广告主一般按点击进行扣费,即广告主通常关心结果,出价原则就看一个点击需要花多少钱。
③广告平台需要把点击出价转化成ECPM进行扣费和排序。
④CTR架起了从点击到曝光的一座桥梁,为排序提供基础。 总结起来就是一个简单的公式——ECPM = 1000CTR点击出价,在上面这个案例中阿迪的ECPM = 1000*1%2 = 20,而耐克的ECPM = 10005%*1 = 50,显然耐克的ECPM大于阿迪的,因此耐克会在这次竞价中胜出。 从这个案例中我们可以看到CTR是为广告排序用的,而排序本身就是竞价广告的核心,因此CTR预估也是竞价广告的核心技术之一。 不仅广告系统需要CTR预估来排序,推荐系统也需要CTR预估来排序,因此CTR预估应用其实比我们想象的要更加广泛: YouTube、亚马逊、今日头条等等涉及到个性化推荐的系统都会应用到CTR预估,即他们要把你最可能点的内容推荐给你。 而广告系统的CTR预估在具体的数值上比推荐系统要求更高,比如推荐系统可能只需要知道A的CTR比B大就可以排序了,而广告由于不是直接用CTR进行排序,还加上了出价,因此广告系统不仅要知道A的CTR比B大,而且还需要知道A的CTR比B的CTR大多少。
CTR预估是如何进行的?
至少有三个特征决定了一个广告的点击率——广告主行业、用户的年龄、用户的性别,事实上,在实际的广告系统中,有无数的因素决定了广告的点击率,我们把这些因素主要分成3类——
第一是广告主侧,比如广告创意、广告的表现形式、广告主行业等,一个劳斯莱斯的广告和一个可口可乐的广告点击率肯定有天壤之别。
第二是用户侧,如人群属性,以上的案例是年龄和性别,事实上,决定创意的因素人群属性极其多——年龄、性别、地域、手机型号、WiFi环境、兴趣…
第三是广告平台侧,比如不同的广告位、投放时间、流量分配机制、频次控制策略等。 这些决定因素在CTR预估中被称之为特征,而CTR预估的第一步就是“特征工程”,即把这些特征找到并数据化。 特征工程是一件复杂的工程,光判断不同特征能否对CTR产生影响就是一个浩大的工程,特征工程的攻城狮们第一步得列出来不同的特征可能对CTR产生影响,这有时候靠直觉,有时候靠经验, 确定了特征之后就需要对这些特征进行处理——即把特征数据化,比如把所有的特征变成0和1的二值化,把连续的特征离散化,把特征的值平滑化、把多个特征向量化… 以上这一段看不懂?看不懂没关系,你只需要明白,所有的这些特征都会被攻城狮们编码变成一串可计算的数组就行,特征工程是一项重要的基础工作,像今日头条、百度这样的广告平台都有一个庞大的团队来做特征工程的工作。 好,特征工程完成之后就开始建立模型了,很多同学看到“模型”二字就开始皱眉头了,没关系,你可以这样理解模型: 模型就是一个黑盒子,在盒子的一方我们输入一大堆参数,盒子的另一端就会输入一个CTR的值。 比如我们输入这样的参数:一个高跟鞋广告主、投放给北京地区、年龄20-30岁、对财经感兴趣的女性用户,在周末投放在微信的朋友圈第三位…请给出一个CTR的值。模型就会根据不同特征的值计算出一个值。
如何评估CTR预估的效果?
好,接下来的一个问题,如何评估CTR预估的效果?工程师们会有特定的指标去衡量效果,对于非技术同学,有人会直观地说,那当然是看CTR有没有变高啊: 正确预估CTR不就是为了把真正高CTR的广告挑出并展示出来么,错误地预估——把高的CTR低估或把低的CTR高估都会让高的CTR不会排在最前面,从而会降低CTR。 这个说法在推荐系统中是成立的,但在广告系统里是不准确的,因为广告的排序不仅仅是CTR排序,它还综合了出价进行排序,即ECPM进行排序,有时候CTR预估准确,反而(实际)CTR会降,我们看一个实际的例子:
在这里插入图片描述
这一大堆数字大家可能看不懂,我们只需要明白以下几个逻辑就能看懂了: i) 广告通过预估ECPM的大小来判断谁胜出,而预估ECPM等于预估CTR出价,在这个案例中,图一CTR预测正确,阿迪的预测CTR30高于耐克的20因而胜出。
ii) 广告实际ECPM是胜出者的ECPM,因为广告平台把所有的曝光都给了胜出者,它等于胜出者的实际CTR
出价。
iii) 图二里把耐克的CTR从2%错误地预估到了4%,导致其预测ECPM高而胜出,而实际上投放出来的CTR为2%。
iv) 这个情况中,预测正确反而CTR低,预测错误反而CTR高,但是没关系图一预估正确的情况下实际的ECPM30高于图二预测错误ECPM20。 所以从这个案例中我们可以看到,从结果指标来看,ECPM是衡量CTR预估最为重要的指标,当然,在实际的实践过程中,CTR预测正确通常ECPM、CTR、收入这些指标通常都会涨。 另外一个很简单的方法就是把预估CTR和真实CTR直接进行对比,由于预估CTR针对每一次广告展示都会预估,比如这一次预估CTR为2%,但单次广告真实CTR只有两个结果,点或不点,即100%、0%,所以看单次结果是没有意义的,我们应该从一个群体来看—— 将每一次广告曝光按照预测的CTR从小到大排序,然后按某个单位(比如每10000个曝光)分别统计平均预估CTR和实际CTR,就能知道预测CTR的准确程度了。