OneRec: Unifying Retrieve and Rank with Generative Recommender and Preference Alignment
前言 过去十多年里,推荐系统大规模应用于短视频、电商、信息流等场景。主流方案几乎都是 **多阶段级联 (cascaded)**: 召回(Recall):从海量库 (~10¹⁰ 级别) 中快速筛出候选。 粗排(Pre-ranking):进一步缩小范围。 精排(Ranking):用复杂模型精细打分。 这种架构的优点是 效率高,能在超大规模库里低延迟返回结果。但也存在一些 固有问题: 计算碎片化