在线广告的点击预估时在线广告网络公司的核心业务,并且也引起了科研节的广泛关注。“Contextual advertising by combining relevance with click feedback.”提出使用上下文文本信息和点击反馈数据来提升预估系统。“Personalized click prediction in sponsored search”和“A maximum entropy approach to natural language processing”在预估系统上使用LR模型。“Learning the click-through rate for rare/new ads from similar ads.”在点击预估系统中使用决策树。
为了预测新广告的CTR,许多工作在不同方面针对冷启动问题展开。“Contextual advertising by combining relevance with click feedback.”使用上下文信息,而“Learning the click-through rate for rare/new ads from similar ads.”使用语义相关的广告,“Estimating rates of rare events with multiple hierarchies through scalable log-linear models.”在广告种类之间使用现有启发式信息来帮助预测新广告的CTR,然而,这些方法不能直接应用于图像展示广告上。在缺乏一个广告的类别的足够信息的情况下,我们不得不依赖于图像特征。由于隐私原因,一些广告系统没有权限从用户身上获得私人信息,并且用户特征不影响项目中不同图像特征的比较。在本文中,我们聚焦于从广告方面设计更好的通用图像特征来处理新图像广告中的冷启动问题。
大量有效的人工制作的图像热症已经对于不同的任务设计出来了。“Visual information retrieval system via content-based approach”使用大量的图像特征来构建一个基于图像检索系统(CBIR)的内容,”Object recognition from local scale- invariant features”对于通用目标识别任务提出了SIFT特征,但是这些人工制作的特征不能直接应用在展示广告任务中,“Multimedia features for click prediction of new ads in display advertising.”和“The impact of visual appearance on user response in online display advertising”提出使用多媒体特征来预测展示广告中的广告的预估概率。他们利用大量图像特征包含亮度、颜 {MOD}、对比度、清晰度、纹理、感兴趣点、显著图等,并且他们明显提升了最好的方法。然而,这些特征主要是固定的人工制作的特征,这些人工制作的特征并不是专门为点击预估模型设计,他们几乎不能捕捉到这项任务的关键因子,并且他们不够灵活。在快速变化的世界中,影响CTR的重要因素也要是演变很快的,固定的手工设计特征对于适应新的展示广告不够灵活,更糟糕的是,他们严重依赖于人类启发式,这是很容易出错并且难以设计的。
特征学习旨在从原始输入中学习到一个特征提取器,比如提取到的特征针对特定任务是非常有效的。卷积神经网络是其中一个最受欢迎的特征学习结构,其能通过学习滤波器来生成一个潜在特征的层次结构。“Imagenet classification with deep convolutional neural networks.”在超过一百万的图像数据集上使用卷积神经网络在图像分类任务上获得了最好的结果。“Visualizing and understanding convolutional neural networks.”发现高维神经元能够学习有趣和直观的高维图案,然而,现有特征学习论文主要集中于自然图像分类。据我们所知,在展示广告的点击预估任务中,仍然还没有工作在特征学习上,此外,现有的特征学习结构可能不适合点击预估问题。