Learning Deep Structured Semantic Models for Web Search using Clickthrough Data
Po-Sen Huang, Xiaodong He, Jianfeng Gao, Li Deng, Alex Acero, Larry Heck
University of Illinois at Urbana-Champaign, Microsoft Research
https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/cikm2013_DSSM_fullversion.pdf
隐含语意模型,比如LSA,旨在将query在语意层面映射到相关的文档,基于关键词的匹配通常效果不好。
这篇文章致力于开发一系列新的深层结构隐含语意模型,将query和文档映射到共享低维空间,其中给定query,文档的相关性已经计算好了,他们的相关性是利用距离来衡量的。
深层结构语意模型训练方式是判别性的,这是因为,其中利用点击数据针对给定query,计算点击文档的最大化条件似然度。为了将该模型用于大规模web搜索应用,作者们利用了词哈希,该操作可以有效扩展语意模型,使其能够处理大量词汇。
新模型在web文档排序的真实数据集上进行了测试,结果表明,其效果显著优于其他隐含语意模型。
现有深层模型细节描述如下
本文所提出的DSSM模型图示如下
DSSM详细描述如下
词嵌入方法简介如下
词哈希大小及冲突大小示例如下
学习过程简介如下
模型结构及训练相关的细节简介如下
数据集及预处理方法简介如下
下面是模型评估指标
几种方法的效果对比如下
我是分割线
您可能感兴趣
WSDM2019|社交注意力记忆网络在推荐系统中的应用(已开源)
SIGIR2020|基于序贯行为的高效迁移学习在用户建模及推荐中的应用(已开源)
WSDM2019|门限注意力自编码在内容感知推荐中的应用(已开源)
WWW2019|对偶图注意力网络在推荐系统中的应用(已开源)
KDD2019|个性化注意力在新闻推荐中的应用
SIGIR2020|序贯元学习方法在重新训练推荐系统中的应用(已开源)
WSDM2019|动态图注意力网络在基于会话的社交推荐中的应用
IJCAI2017|基于注意力机制的FM模型AFM在学习特征交互权重中的应用(已开源)
KDD2020|自动特征交互选择(AutoFIS)分解机模型在CTR预估中的应用(已开源)
SIGIR2020|LightGCN图卷积网络在推荐系统中的应用(已开源)
WWW2019|图神经网络在社交推荐中的应用
AAAI2019|自注意力度量学习在下一个商品推荐中的应用
WWW2020|基于隐含意图的注意力序列模型在下一个商品推荐中的应用
WWW2015|深度学习在推荐系统跨域用户建模中的应用
ICDE2020|多图卷积网络在草药推荐中的应用
ATM|注意力转移模型在预测下一个商品中的应用
IJCAI2019|深层自注意力网络在序列推荐中的应用
AAAI2020|深度学习在表格分析中的应用
NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)
AAAI2020|结合时空信息的分层注意力网络在大规模社交网络中的应用
ICDE2020|基于深度学习的关系抽取
只有正样本和无标签样本时如何构建分类器
ICDE2020|图卷积网络在价格感知推荐中的应用
WSDM2020|基于强化学习的多轮对话推荐系统(EAR, 即将开源)
WWW2020|如何利用未来数据协助训练基于会话的推荐(GRec)
ICML2018|基于自注意力的序列推荐模型SASRec(已开源)
IJCAI2018|分层时空LSTM在位置预测中的应用(HST-LSTM)
IJCAI2019|基于会话和注意力机制的CTR预估模型DSIN(已开源)
AISTATS2018|密歇根大学提出新型在线boosting算法用于多标签排序(已开源)
AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)
ICML2007|深度学习用于协同过滤的开篇作之一(出自深度学习鼻祖之一Hinton)
SIGIR2019|基于BERT的深度学习模型在信息检索中的应用(已开源)
SIGIR2019|深度学习如何更好地用于学习排序(LTR)(已开源)
SIGIR2019|利用DeepSHAP来解释神经检索模型(已开源)
KDD2018|基于GBM的动态定价回归模型
RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET
SIGIR2018|选择性GBDT(SelGB)用于排序学习(已开源)
IJCAI2019|基于对抗变分自编码的协同过滤框架VAEGAN
聊聊CatBoost
聊聊XGBoost CatBoost LightGBM RF GBDT
顶会中深度学习用于CTR预估的论文及代码集锦 (3)
ICML 2018 深度学习论文及代码集锦(5)
深度学习用于机器翻译的论文及代码集锦
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
QQ咨询|关于我们|Archiver|手机版|小黑屋|( 辽ICP备15012455号-4 ) Powered by 期权论坛 X3.2 © 2001-2016 期权工具网&期权论坛 Inc.
下载期权论坛手机APP