diff --git a/chapter_introduction/index.md b/chapter_introduction/index.md index 7462b753f..d99ab93e7 100644 --- a/chapter_introduction/index.md +++ b/chapter_introduction/index.md @@ -367,16 +367,27 @@ #### 推荐系统 :label:`subsec_recommender_systems` -推荐系统是另一个与搜索和排名相关的问题。问题是相似的,因为目标是向用户显示一组相关的项目。主要区别在于强调*个性化*推荐给特定用户。例如,对于电影推荐,科幻迷的结果页面和喜剧爱好者的结果页面可能会有很大不同。类似的问题也会出现在其他推荐设置中,例如零售产品、音乐和新闻推荐。 - -在某些情况下,客户会提供明确的反馈,传达他们对特定产品的喜爱程度(例如,亚马逊上的产品评级和评论)。在其他一些情况下,他们会提供隐性反馈,例如,跳过播放列表中的某些歌曲,这可能是在表示不满,但可能只是表明歌曲在上下文中不合适。在最简单的公式中,这些系统被训练成在给定用户和物品的情况下估计某些分数,例如估计的评级或购买的概率。 - -给定这样的模型,对于任何给定的用户,我们都可以检索得分最高的对象集,然后将其推荐给用户。生产系统要先进得多,在计算这样的分数时,会将详细的用户活动和项目特征考虑在内。:numref:`fig_deeplearning_amazon`是亚马逊基于个性化算法推荐的深度学习书籍的一个例子,该算法经过调整,可以捕捉一个人的偏好。 +另一类与搜索和排名相关的问题是*推荐系统*(recommender system),它的目标是向给特定用户进行“个性化”推荐。 +例如,对于电影推荐,科幻迷和喜剧爱好者的推荐结果页面可能会有很大不同。 +类似的应用也会出现在零售产品、音乐和新闻推荐等等。 + +在某些应用中,客户会提供明确反馈,表达他们对特定产品的喜爱程度。 +例如,亚马逊上的产品评级和评论。 +在其他一些情况下,客户会提供隐性反馈。 +例如,某用户跳过播放列表中的某些歌曲,这可能说明歌曲对此用户不大合适。 +总的来说,推荐系统会为“给定用户和物品”的匹配性打分,这个“分数”可能是估计的评级或购买的概率。 +由此,对于任何给定的用户,推荐系统都可以检索得分最高的对象集,然后将其推荐给用户。以上只是简单的算法,而工艺生产的推荐系统要先进得多,它会将详细的用户活动和项目特征考虑在内。 +推荐系统算法经过调整,可以捕捉一个人的偏好。 +比如,:numref:`fig_deeplearning_amazon`是亚马逊基于个性化算法推荐的深度学习书籍,成功的捕捉了作者的喜好。 ![亚马逊推荐的深度学习书籍。](../img/deeplearning-amazon.jpg) :label:`fig_deeplearning_amazon` -尽管它们具有巨大的经济价值,但单纯建立在预测模型之上的推荐系统仍存在一些严重的概念缺陷。首先,我们只观察“审查后的反馈”:用户更倾向于给他们感觉强烈的电影打分。例如,在五分制中,您可能会注意到,电影会获得了许多五星级和一星级评级,但三星级评级却明显很少。此外,目前的购买习惯往往是由于目前的推荐算法,但学习算法并不总是考虑到这一细节。因此,有可能形成反馈循环,推荐系统会优先推送一个被认为更好(由于购买量较大)的商品,进而更频繁地被推荐。关于如何处理审查、激励和反馈循环的许多问题,都是重要的开放性研究问题。 +尽管推荐系统具有巨大的应用价值,但单纯用它作为预测模型仍存在一些缺陷。 +首先,我们的数据只包含“审查后的反馈”:用户更倾向于给他们感觉强烈的事物打分。 +例如,在五分制电影评分中,会有许多五星级和一星级评分,但三星级却明显很少。 +此外,推荐系统有可能形成反馈循环:推荐系统首先会优先推送一个购买量较大(可能被认为更好)的商品,然而目前用户的购买习惯往往是遵循推荐算法,但学习算法并不总是考虑到这一细节,进而更频繁地被推荐。 +综上所述,关于如何处理审查、激励和反馈循环的许多问题,都是重要的开放性研究问题。 #### 序列学习