阿里REG4Rec:推理增强的生成式推荐模型,赋能Lazada电商场景

从学术角度分析,这是一个典型的Exploration-Exploitation问题。REG4Rec需要设计合理的策略来控制探索与利用之间的平衡。例如,可以引入Thompson Sampling或者Epsilon-Greedy等方法来动态调整探索的概率。同时,可以结合Item的冷启动问题一起考虑,对于用户交互较少的Item赋予更高的探索权重。