tech-econ

Learning to Rank

Train models that order search results optimally

2010 1028 cited

From RankNet to LambdaRank to LambdaMART: An Overview

Chris Burges

Definitive reference unifying the RankNet family; LambdaMART remains the industry workhorse for gradient-boosted ranking.

2005

Learning to Rank using Gradient Descent (RankNet)

Chris Burges, et al.

Foundational pairwise neural ranking using cross-entropy loss; won ICML Test of Time Award 2015.

2007 1912 cited

Learning to Rank: From Pairwise to Listwise (ListNet)

Zhe Cao, Tao Qin, Tie-Yan Liu, Ming-Feng Tsai, Hang Li

First listwise method using probability distributions over permutations; influenced all subsequent listwise methods.

2008 686 cited

Listwise Approach to Learning to Rank (ListMLE)

Fen Xia, Tie-Yan Liu, Jue Wang, Wensheng Zhang, Hang Li

Foundational listwise LTR with theoretical analysis of listwise loss functions.

2002 8000 cited

Optimizing Search Engines using Clickthrough Data

Thorsten Joachims

Seminal SVM-based pairwise LTR using click data for preference constraints; established click-based learning to rank paradigm.

Title	Authors	Year	Citations
From RankNet to LambdaRank to LambdaMART: An Overview Definitive reference unifying the RankNet family; LambdaMART remains the industry workhorse for gradient-boosted ranking.	Chris Burges	2010	1028
Learning to Rank using Gradient Descent (RankNet) Foundational pairwise neural ranking using cross-entropy loss; won ICML Test of Time Award 2015.	Chris Burges, et al.	2005	—
Learning to Rank: From Pairwise to Listwise (ListNet) First listwise method using probability distributions over permutations; influenced all subsequent listwise methods.	Zhe Cao, Tao Qin, Tie-Yan Liu, Ming-Feng Tsai, Hang Li	2007	1912
Listwise Approach to Learning to Rank (ListMLE) Foundational listwise LTR with theoretical analysis of listwise loss functions.	Fen Xia, Tie-Yan Liu, Jue Wang, Wensheng Zhang, Hang Li	2008	686
Optimizing Search Engines using Clickthrough Data Seminal SVM-based pairwise LTR using click data for preference constraints; established click-based learning to rank paradigm.	Thorsten Joachims	2002	8000

Query Understanding

Figure out what users actually want from their searches

2004 933 cited

Understanding User Goals in Web Search

Daniel Rose, Danny Levinson

Seminal taxonomy of query intent (navigational, informational, transactional); foundational framework still used today.

2006 276 cited

Building Bridges for Web Query Classification

Dou Shen, Rong Pan, Jian-Tao Sun, Jeffrey Junfeng Pan, Kangheng Wu, Jie Yin, Qiang Yang

Foundational work on mapping queries to topic categories using intermediary data sources.

2020 3 cited

Deep Search Query Intent Understanding

Bo Xiang, et al. (Facebook)

Industrial-scale BERT-based intent classification for typeahead and search blending.

2001 3000 cited

Relevance-Based Language Models

Victor Lavrenko, W. Bruce Croft

Foundational pseudo-relevance feedback method introducing RM3; widely used for query expansion in both traditional and neural retrieval.

2005 500 cited

Context-Sensitive Information Retrieval Using Implicit Feedback

Xuehua Shen, Bin Tan, ChengXiang Zhai

Pioneered use of session context for query interpretation; demonstrated significant gains from implicit user feedback.

2020 150 cited

Few-Shot Generative Conversational Query Rewriting

Shi Yu, Jiahua Liu, Jie Yang, Chenyan Xiong, Paul Bennett, Jianfeng Gao, Zhiyuan Liu

Modern neural query reformulation using GPT-2 for conversational settings; addresses context carryover in multi-turn search.

Title	Authors	Year	Citations
Understanding User Goals in Web Search Seminal taxonomy of query intent (navigational, informational, transactional); foundational framework still used today.	Daniel Rose, Danny Levinson	2004	933
Building Bridges for Web Query Classification Foundational work on mapping queries to topic categories using intermediary data sources.	Dou Shen, Rong Pan, Jian-Tao Sun, Jeffrey Junfeng Pan, Kangheng Wu, Jie Yin, Qiang Yang	2006	276
Deep Search Query Intent Understanding Industrial-scale BERT-based intent classification for typeahead and search blending.	Bo Xiang, et al. (Facebook)	2020	3
Relevance-Based Language Models Foundational pseudo-relevance feedback method introducing RM3; widely used for query expansion in both traditional and neural retrieval.	Victor Lavrenko, W. Bruce Croft	2001	3000
Context-Sensitive Information Retrieval Using Implicit Feedback Pioneered use of session context for query interpretation; demonstrated significant gains from implicit user feedback.	Xuehua Shen, Bin Tan, ChengXiang Zhai	2005	500
Few-Shot Generative Conversational Query Rewriting Modern neural query reformulation using GPT-2 for conversational settings; addresses context carryover in multi-turn search.	Shi Yu, Jiahua Liu, Jie Yang, Chenyan Xiong, Paul Bennett, Jianfeng Gao, Zhiyuan Liu	2020	150

Relevance vs. Engagement

Short-term clicks vs. satisfaction

2016 3182 cited

Deep Neural Networks for YouTube Recommendations

Paul Covington, Jay Adams, Emre Sargin

Landmark paper on watch-time optimization vs. clicks; explains freshness handling at scale.

2019 287 cited

Recommending What Video to Watch Next

Zhe Zhao, et al. (Google)

Multi-objective ranking balancing engagement with satisfaction using multi-gate mixture-of-experts.

2019 90 cited

150 Successful ML Models: 6 Lessons at Booking.com

Lucas Bernardi, et al.

Influential industry paper on balancing business metrics vs. user value in production systems.

2025 26 cited

Engagement, User Satisfaction, and Divisive Content Amplification

Smitha Milli, et al.

Demonstrates empirically that engagement-based ranking underperforms for user satisfaction.

2014 500 cited

Modeling Dwell Time to Predict Click-level Satisfaction

Youngho Kim, Ahmed Hassan, Ryen W. White, Imed Zitouni

Established context-dependent satisfaction thresholds beyond fixed dwell time cutoffs; showed satisfaction prediction requires query-document context.

2013 400 cited

Beyond Clicks: Query Reformulation as a Predictor of Search Satisfaction

Ahmed Hassan, Xiaolin Shi, Nick Craswell, Bill Ramsey

Demonstrated satisfaction signals exist beyond clicks; query reformulation patterns predict user satisfaction better than clicks alone.

Title	Authors	Year	Citations
Deep Neural Networks for YouTube Recommendations Landmark paper on watch-time optimization vs. clicks; explains freshness handling at scale.	Paul Covington, Jay Adams, Emre Sargin	2016	3182
Recommending What Video to Watch Next Multi-objective ranking balancing engagement with satisfaction using multi-gate mixture-of-experts.	Zhe Zhao, et al. (Google)	2019	287
150 Successful ML Models: 6 Lessons at Booking.com Influential industry paper on balancing business metrics vs. user value in production systems.	Lucas Bernardi, et al.	2019	90
Engagement, User Satisfaction, and Divisive Content Amplification Demonstrates empirically that engagement-based ranking underperforms for user satisfaction.	Smitha Milli, et al.	2025	26
Modeling Dwell Time to Predict Click-level Satisfaction Established context-dependent satisfaction thresholds beyond fixed dwell time cutoffs; showed satisfaction prediction requires query-document context.	Youngho Kim, Ahmed Hassan, Ryen W. White, Imed Zitouni	2014	500
Beyond Clicks: Query Reformulation as a Predictor of Search Satisfaction Demonstrated satisfaction signals exist beyond clicks; query reformulation patterns predict user satisfaction better than clicks alone.	Ahmed Hassan, Xiaolin Shi, Nick Craswell, Bill Ramsey	2013	400

Position Bias & Debiasing

Account for the fact that top results get more clicks

2008 935 cited

An Experimental Comparison of Click Position-Bias Models

Nick Craswell, Onno Zoeter, Michael Taylor, Bill Ramsey

Seminal empirical study establishing cascade model as best explanation for user examination behavior.

2017 495 cited

Unbiased Learning-to-Rank with Biased Feedback

Thorsten Joachims, Adith Swaminathan, Tobias Schnabel

Foundational counterfactual/IPS framework for unbiased LTR; propensity-weighted ranking SVM.

2015 260 cited

Click Models for Web Search

Aleksandr Chuklin, Ilya Markov, Maarten de Rijke

Comprehensive synthesis covering all major click models (PBM, DCM, DBN, UBM); essential reference.

2018 179 cited

Unbiased LTR with Unbiased Propensity Estimation (DLA)

Qingyao Ai, Keping Bi, Cheng Luo, Jiafeng Guo, W. Bruce Croft

Dual learning algorithm jointly training ranking and propensity models; widely used for production debiasing.

2020 36 cited

Improving Deep Learning for Airbnb Search

Malay Haldar, et al.

Practical industry case on position bias correction via dropout at inference; shows major production gains.

2019 150 cited

Addressing Trust Bias for Unbiased Learning-to-Rank

Aman Agarwal, Xuanhui Wang, Cheng Li, Michael Bendersky, Marc Najork

First rigorous treatment of trust bias in ULTR framework; extends counterfactual work to account for users trusting higher-ranked results more.

Title	Authors	Year	Citations
An Experimental Comparison of Click Position-Bias Models Seminal empirical study establishing cascade model as best explanation for user examination behavior.	Nick Craswell, Onno Zoeter, Michael Taylor, Bill Ramsey	2008	935
Unbiased Learning-to-Rank with Biased Feedback Foundational counterfactual/IPS framework for unbiased LTR; propensity-weighted ranking SVM.	Thorsten Joachims, Adith Swaminathan, Tobias Schnabel	2017	495
Click Models for Web Search Comprehensive synthesis covering all major click models (PBM, DCM, DBN, UBM); essential reference.	Aleksandr Chuklin, Ilya Markov, Maarten de Rijke	2015	260
Unbiased LTR with Unbiased Propensity Estimation (DLA) Dual learning algorithm jointly training ranking and propensity models; widely used for production debiasing.	Qingyao Ai, Keping Bi, Cheng Luo, Jiafeng Guo, W. Bruce Croft	2018	179
Improving Deep Learning for Airbnb Search Practical industry case on position bias correction via dropout at inference; shows major production gains.	Malay Haldar, et al.	2020	36
Addressing Trust Bias for Unbiased Learning-to-Rank First rigorous treatment of trust bias in ULTR framework; extends counterfactual work to account for users trusting higher-ranked results more.	Aman Agarwal, Xuanhui Wang, Cheng Li, Michael Bendersky, Marc Najork	2019	150

Semantic Search & Embeddings

Match meaning, not just keywords

2020

Dense Passage Retrieval for Open-Domain QA (DPR)

Vladimir Karpukhin, et al. (Facebook)

Foundational dual-encoder dense retrieval; outperforms BM25 by 9-19%; established the dense retrieval paradigm.

2020 189 cited

ColBERT: Efficient Passage Search via Late Interaction

Omar Khattab, Matei Zaharia

Introduced late interaction achieving near cross-encoder quality with bi-encoder speed.

2019 345 cited

Passage Re-ranking with BERT

Rodrigo Nogueira, Kyunghyun Cho

Transformative demonstration of BERT for passage re-ranking; 27% improvement on MS MARCO.

2018 302 cited

Real-time Personalization using Embeddings at Airbnb

Mihajlo Grbovic, Haibin Cheng

Best Paper Award. Production embedding system driving 99% of Airbnb conversions.

2019 9199 cited

Sentence-BERT: Sentence Embeddings using Siamese Networks

Nils Reimers, Iryna Gurevych

Made BERT practical for dense retrieval with siamese architecture; widely used for semantic similarity.

2021 500 cited

SPLADE: Sparse Lexical and Expansion Model for First Stage Ranking

Thibault Formal, Benjamin Piwowarski, Stéphane Clinchant

Learned sparse representations via MLM head with sparsity regularization; bridges gap between dense and sparse retrieval with interpretable term weights.

2021 400 cited

RocketQA: An Optimized Training Approach to Dense Passage Retrieval

Yingqi Qu, Yuchen Ding, Jing Liu, Kai Liu, Ruiyang Ren, Wayne Xin Zhao, Daxiang Dong, Hua Wu, Haifeng Wang

Critical training strategies for dense retrieval: cross-batch negatives, denoised hard negatives, knowledge distillation from cross-encoder. Baidu research.

2021 1000 cited

Approximate Nearest Neighbor Negative Contrastive Learning for Dense Text Retrieval

Lee Xiong, Chenyan Xiong, Ye Li, Kwok-Fung Tang, Jialin Liu, Paul Bennett, Junaid Ahmed, Arnold Overwijk

Global hard negative mining via ANN index (ANCE); addresses limitation of in-batch negatives by refreshing hard negatives from evolving model.

Title	Authors	Year	Citations
Dense Passage Retrieval for Open-Domain QA (DPR) Foundational dual-encoder dense retrieval; outperforms BM25 by 9-19%; established the dense retrieval paradigm.	Vladimir Karpukhin, et al. (Facebook)	2020	—
ColBERT: Efficient Passage Search via Late Interaction Introduced late interaction achieving near cross-encoder quality with bi-encoder speed.	Omar Khattab, Matei Zaharia	2020	189
Passage Re-ranking with BERT Transformative demonstration of BERT for passage re-ranking; 27% improvement on MS MARCO.	Rodrigo Nogueira, Kyunghyun Cho	2019	345
Real-time Personalization using Embeddings at Airbnb Best Paper Award. Production embedding system driving 99% of Airbnb conversions.	Mihajlo Grbovic, Haibin Cheng	2018	302
Sentence-BERT: Sentence Embeddings using Siamese Networks Made BERT practical for dense retrieval with siamese architecture; widely used for semantic similarity.	Nils Reimers, Iryna Gurevych	2019	9199
SPLADE: Sparse Lexical and Expansion Model for First Stage Ranking Learned sparse representations via MLM head with sparsity regularization; bridges gap between dense and sparse retrieval with interpretable term weights.	Thibault Formal, Benjamin Piwowarski, Stéphane Clinchant	2021	500
RocketQA: An Optimized Training Approach to Dense Passage Retrieval Critical training strategies for dense retrieval: cross-batch negatives, denoised hard negatives, knowledge distillation from cross-encoder. Baidu research.	Yingqi Qu, Yuchen Ding, Jing Liu, Kai Liu, Ruiyang Ren, Wayne Xin Zhao, Daxiang Dong, Hua Wu, Haifeng Wang	2021	400
Approximate Nearest Neighbor Negative Contrastive Learning for Dense Text Retrieval Global hard negative mining via ANN index (ANCE); addresses limitation of in-batch negatives by refreshing hard negatives from evolving model.	Lee Xiong, Chenyan Xiong, Ye Li, Kwok-Fung Tang, Jialin Liu, Paul Bennett, Junaid Ahmed, Arnold Overwijk	2021	1000

Neural Ranking Models

Use deep learning for search relevance

2019 400 cited

Multi-Stage Document Ranking with BERT

Rodrigo Nogueira, Wei Yang, Kyunghyun Cho, Jimmy Lin

Established BERT-based cross-encoder reranking paradigm with MonoBERT and duoBERT; 'Expando-Mono-Duo' design pattern for neural IR pipelines.

2019 300 cited

From doc2query to docTTTTTquery

Rodrigo Nogueira, Jimmy Lin

Neural document expansion via T5-generated queries; improves BM25 without runtime overhead by enriching documents at indexing time.

2016 800 cited

A Deep Relevance Matching Model for Ad-hoc Retrieval

Jiafeng Guo, Yixing Fan, Qingyao Ai, W. Bruce Croft

Distinguished 'relevance matching' from 'semantic matching' in neural IR; histogram-based matching with term gating mechanism.

2017 560 cited

End-to-End Neural Ad-hoc Ranking with Kernel Pooling

Chenyan Xiong, Zhuyun Dai, Jamie Callan, Zhiyuan Liu, Russell Power

Pioneered end-to-end neural ranking with interpretable soft-match kernels (K-NRM); spawned KNRM variants used in production.

2022 250 cited

Unsupervised Corpus Aware Language Model Pre-training for Dense Passage Retrieval

Luyu Gao, Jamie Callan

Pre-training specifically for dense retrieval via Condenser architecture; coCondenser adds corpus-aware contrastive objective for further gains.

Title	Authors	Year	Citations
Multi-Stage Document Ranking with BERT Established BERT-based cross-encoder reranking paradigm with MonoBERT and duoBERT; 'Expando-Mono-Duo' design pattern for neural IR pipelines.	Rodrigo Nogueira, Wei Yang, Kyunghyun Cho, Jimmy Lin	2019	400
From doc2query to docTTTTTquery Neural document expansion via T5-generated queries; improves BM25 without runtime overhead by enriching documents at indexing time.	Rodrigo Nogueira, Jimmy Lin	2019	300
A Deep Relevance Matching Model for Ad-hoc Retrieval Distinguished 'relevance matching' from 'semantic matching' in neural IR; histogram-based matching with term gating mechanism.	Jiafeng Guo, Yixing Fan, Qingyao Ai, W. Bruce Croft	2016	800
End-to-End Neural Ad-hoc Ranking with Kernel Pooling Pioneered end-to-end neural ranking with interpretable soft-match kernels (K-NRM); spawned KNRM variants used in production.	Chenyan Xiong, Zhuyun Dai, Jamie Callan, Zhiyuan Liu, Russell Power	2017	560
Unsupervised Corpus Aware Language Model Pre-training for Dense Passage Retrieval Pre-training specifically for dense retrieval via Condenser architecture; coCondenser adds corpus-aware contrastive objective for further gains.	Luyu Gao, Jamie Callan	2022	250

Retrieval-Augmented Generation

Combine search with generative AI

2020 1500 cited

REALM: Retrieval-Augmented Language Model Pre-Training

Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat, Ming-Wei Chang

First end-to-end pre-training of retrieval + LM with backpropagation through retrieval; foundational architecture for knowledge-intensive tasks.

2020 5000 cited

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela

THE paper that coined 'RAG'; combines pre-trained retriever with seq2seq generator for open-domain QA. Foundation for modern RAG systems.

2021 1200 cited

Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering

Gautier Izacard, Edouard Grave

Fusion-in-Decoder (FiD) architecture enabling efficient scaling to 100+ passages; backbone of Atlas and subsequent RAG systems.

2022 400 cited

Transformer Memory as a Differentiable Search Index

Yi Tay, Vinh Tran, Mostafa Dehghani, Jianmo Ni, Dara Bahri, Harsh Mehta, Zhen Qin, Kai Hui, Zhe Zhao, Jai Gupta, Tal Schuster, William W. Cohen, Donald Metzler

Generative retrieval paradigm (DSI): model memorizes corpus and generates document IDs directly; alternative to dense/sparse retrieve-then-rank.

Title	Authors	Year	Citations
REALM: Retrieval-Augmented Language Model Pre-Training First end-to-end pre-training of retrieval + LM with backpropagation through retrieval; foundational architecture for knowledge-intensive tasks.	Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat, Ming-Wei Chang	2020	1500
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks THE paper that coined 'RAG'; combines pre-trained retriever with seq2seq generator for open-domain QA. Foundation for modern RAG systems.	Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela	2020	5000
Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering Fusion-in-Decoder (FiD) architecture enabling efficient scaling to 100+ passages; backbone of Atlas and subsequent RAG systems.	Gautier Izacard, Edouard Grave	2021	1200
Transformer Memory as a Differentiable Search Index Generative retrieval paradigm (DSI): model memorizes corpus and generates document IDs directly; alternative to dense/sparse retrieve-then-rank.	Yi Tay, Vinh Tran, Mostafa Dehghani, Jianmo Ni, Dara Bahri, Harsh Mehta, Zhen Qin, Kai Hui, Zhe Zhao, Jai Gupta, Tal Schuster, William W. Cohen, Donald Metzler	2022	400

Evaluation Methods for IR

Measure search quality effectively

2002 10000 cited

Cumulated Gain-Based Evaluation of IR Techniques

Kalervo Järvelin, Jaana Kekäläinen

Introduced DCG and NDCG; most widely used ranking metric enabling graded relevance evaluation.

2009 800 cited

Expected Reciprocal Rank for Graded Relevance

Olivier Chapelle, Donald Metzler, Ya Zhang, Pierre Grinspan

Cascade-based metric modeling user stopping behavior; primary TREC Web Track metric accounting for diminishing returns.

2016 2000 cited

MS MARCO: A Human Generated MAchine Reading COmprehension Dataset

Payal Bajaj, Daniel Campos, Nick Craswell, Li Deng, Jianfeng Gao, Xiaodong Liu, Rangan Majumder, Andrew McNamara, Bhaskar Mitra, Tri Nguyen, Mir Rosenberg, Xia Song, Alina Stoica, Saurabh Tiwary, Tong Wang

Large-scale passage ranking benchmark with 1M queries; enabled neural retrieval research and remains primary leaderboard.

2021 800 cited

BEIR: A Heterogeneous Benchmark for Zero-shot Evaluation of Information Retrieval Models

Nandan Thakur, Nils Reimers, Andreas Rücklé, Abhishek Srivastava, Iryna Gurevych

18-dataset benchmark testing out-of-distribution generalization; key finding that BM25 remains robust while dense models struggle on domain shift.

2012 400 cited

Large-Scale Validation and Analysis of Interleaved Search Evaluation

Olivier Chapelle, Thorsten Joachims, Filip Radlinski, Yisong Yue

Definitive validation of interleaving as online A/B testing gold standard; demonstrated high agreement with editorial judgments at scale.

Title	Authors	Year	Citations
Cumulated Gain-Based Evaluation of IR Techniques Introduced DCG and NDCG; most widely used ranking metric enabling graded relevance evaluation.	Kalervo Järvelin, Jaana Kekäläinen	2002	10000
Expected Reciprocal Rank for Graded Relevance Cascade-based metric modeling user stopping behavior; primary TREC Web Track metric accounting for diminishing returns.	Olivier Chapelle, Donald Metzler, Ya Zhang, Pierre Grinspan	2009	800
MS MARCO: A Human Generated MAchine Reading COmprehension Dataset Large-scale passage ranking benchmark with 1M queries; enabled neural retrieval research and remains primary leaderboard.	Payal Bajaj, Daniel Campos, Nick Craswell, Li Deng, Jianfeng Gao, Xiaodong Liu, Rangan Majumder, Andrew McNamara, Bhaskar Mitra, Tri Nguyen, Mir Rosenberg, Xia Song, Alina Stoica, Saurabh Tiwary, Tong Wang	2016	2000
BEIR: A Heterogeneous Benchmark for Zero-shot Evaluation of Information Retrieval Models 18-dataset benchmark testing out-of-distribution generalization; key finding that BM25 remains robust while dense models struggle on domain shift.	Nandan Thakur, Nils Reimers, Andreas Rücklé, Abhishek Srivastava, Iryna Gurevych	2021	800
Large-Scale Validation and Analysis of Interleaved Search Evaluation Definitive validation of interleaving as online A/B testing gold standard; demonstrated high agreement with editorial judgments at scale.	Olivier Chapelle, Thorsten Joachims, Filip Radlinski, Yisong Yue	2012	400

Personalized & Conversational Search

Adapt search to individual users and context

2005 1000 cited

Personalizing Search via Automated Analysis of Interests and Activities

Jaime Teevan, Susan T. Dumais, Eric Horvitz

Foundational personalization paper establishing paradigm for implicit user modeling from desktop and search history.

2012 700 cited

Modeling the Impact of Short- and Long-Term Behavior on Search Personalization

Paul N. Bennett, Ryen W. White, Wei Chu, Susan T. Dumais, Peter Bailey, Fedor Borisyuk, Xiaoyuan Cui

Established distinction between session-level and historical personalization signals; showed combination outperforms either alone.

2010 300 cited

Context-Aware Ranking in Web Search

Biao Xiang, Daxin Jiang, Jian Pei, Xiaohui Sun, Enhong Chen, Hang Li

Operationalized session and context signals in production LTR frameworks; showed how to integrate behavioral context into ranking features.

2020 200 cited

TREC CAsT 2019: The Conversational Assistance Track

Jeffrey Dalton, Chenyan Xiong, Jamie Callan

Defining benchmark for conversational IR with 80 dialogues over 38M passages; established evaluation methodology for multi-turn search.

2020 180 cited

Open-Retrieval Conversational Question Answering

Chen Qu, Liu Yang, Cen Chen, Minghui Qiu, W. Bruce Croft, Mohit Iyyer

Open-domain retrieval for conversational QA; advances beyond simplified settings with ORConvQA dataset and baselines.

Title	Authors	Year	Citations
Personalizing Search via Automated Analysis of Interests and Activities Foundational personalization paper establishing paradigm for implicit user modeling from desktop and search history.	Jaime Teevan, Susan T. Dumais, Eric Horvitz	2005	1000
Modeling the Impact of Short- and Long-Term Behavior on Search Personalization Established distinction between session-level and historical personalization signals; showed combination outperforms either alone.	Paul N. Bennett, Ryen W. White, Wei Chu, Susan T. Dumais, Peter Bailey, Fedor Borisyuk, Xiaoyuan Cui	2012	700
Context-Aware Ranking in Web Search Operationalized session and context signals in production LTR frameworks; showed how to integrate behavioral context into ranking features.	Biao Xiang, Daxin Jiang, Jian Pei, Xiaohui Sun, Enhong Chen, Hang Li	2010	300
TREC CAsT 2019: The Conversational Assistance Track Defining benchmark for conversational IR with 80 dialogues over 38M passages; established evaluation methodology for multi-turn search.	Jeffrey Dalton, Chenyan Xiong, Jamie Callan	2020	200
Open-Retrieval Conversational Question Answering Open-domain retrieval for conversational QA; advances beyond simplified settings with ORConvQA dataset and baselines.	Chen Qu, Liu Yang, Cen Chen, Minghui Qiu, W. Bruce Croft, Mohit Iyyer	2020	180

Result Diversification

Show varied results that cover different intents

1998 2500 cited

The Use of MMR, Diversity-Based Reranking for Reordering Documents and Producing Summaries

Jaime Carbonell, Jade Goldstein

THE seminal diversification paper introducing Maximal Marginal Relevance (MMR) formula; balances relevance with novelty.

2008 1000 cited

Novelty and Diversity in Information Retrieval Evaluation

Charles L.A. Clarke, Maheedhar Kolla, Gordon V. Cormack, Olga Vechtomova, Azin Ashkan, Stefan Büttcher, Ian MacKinnon

Standard evaluation framework for diversity introducing α-nDCG; enabled TREC Web diversity track and systematic diversity research.

2009 600 cited

Diversifying Search Results

Rakesh Agrawal, Sreenivas Gollapudi, Alan Halverson, Samuel Ieong

Intent-aware diversification with formal coverage guarantees; models query as distribution over intents and optimizes expected coverage.

Title	Authors	Year	Citations
The Use of MMR, Diversity-Based Reranking for Reordering Documents and Producing Summaries THE seminal diversification paper introducing Maximal Marginal Relevance (MMR) formula; balances relevance with novelty.	Jaime Carbonell, Jade Goldstein	1998	2500
Novelty and Diversity in Information Retrieval Evaluation Standard evaluation framework for diversity introducing α-nDCG; enabled TREC Web diversity track and systematic diversity research.	Charles L.A. Clarke, Maheedhar Kolla, Gordon V. Cormack, Olga Vechtomova, Azin Ashkan, Stefan Büttcher, Ian MacKinnon	2008	1000
Diversifying Search Results Intent-aware diversification with formal coverage guarantees; models query as distribution over intents and optimizes expected coverage.	Rakesh Agrawal, Sreenivas Gollapudi, Alan Halverson, Samuel Ieong	2009	600