1 背景说明
我们知道,在信息流广告中,广告的展现形式通常分为三种:
- 大图:点击率最高,对图文相关性要求也最高
- 小图:点击率相对偏低,不占用屏幕
- 三图:介于大图和小图之间
以上三种广告展现形式已经被证明能够很好的融入到信息流广告中,在保证用户体验的情况下,恰当的让广告得到展示。
最近在做物料优化时,接触到这样的一个场景:大图样式中,基本上每个关键词对应一张图;小图样式中,同样如此;三图样式和小图样式共用一套图集;那么问题来了,当请求的样式的三图时,由于平均每个关键词只有一张小图,导致在我们的三图样式中,对大部分关键词,另外的两张图采用行业打底形式(也就是给关键词所对应的行业配几张通用的图片),这就导致了这些关键词的点击率不高,有些场景下甚至会影响用户体验。那么,如何在仅有一张图片的境况下,快速给这个关键词配上另外的几张图呢?
2 CNN以图找图原理及实现
2.1 以图找图原理
既然一个关键词已经有一张图了,那么根据这张图在几万图片集合中能否找出跟这个图片最接近的几张图呢?答案是肯定的。
这样我想到了在NLP中计算词和词的相关性上,通过词的vector计算词与词之间的余弦距离,就能计算词与词之间的距离,也就能找出近似词。寻着这个启发,只需要得到一个图片的vector表示即可!就比较简单了,直接用现成的模型VGG,Inception,ResNet等等就可以,抽取其中的高阶特征,即可得到图片的向量表示,再计算整个图片集中的图片与给定图片的cosine举例,取相关性top的图,就是内容最接近的图。实验证明,这种以图找图的方式,可靠度接近95%,大大节省了人工找图成本。
2.2 以图找图tensorflow实现
这里我就以现有的VGG为例,直接抽取vgg的第七个全连接层的向量作为图片的表示,然后再计算余弦距离,再排序取topN即可。部分实现代码如下: