【机器学习:推荐系统】什么是推荐系统?
推荐系统如何工作?推荐系统生命周期推荐系统算法使用推荐系统的好处推荐系统的类型协同过滤基于内容的过滤混合过滤现实生活中的推荐系统示例亚马逊Spotify脸书/元数据Netflix谷歌和 YouTube关于推荐系统的最终想法推荐系统(或称推荐器系统)是一种软件引擎,旨在根据用户以往的好恶、产品参与度和互动情况等向用户推荐商品。推荐系统能让用户对网站持续推荐的内容保持兴趣。推荐引擎通过帮助每一位消费者
本文翻译转载自:What are Recommendation Systems?
【机器学习:推荐系统】什么是推荐系统?
推荐系统(或称推荐器系统)是一种软件引擎,旨在根据用户以往的好恶、产品参与度和互动情况等向用户推荐商品。推荐系统能让用户对网站持续推荐的内容保持兴趣。
推荐引擎通过帮助每一位消费者识别和发现他们喜爱的电影、电视节目、数字产品、书籍、文章、服务等,提供个性化的用户体验。这些系统帮助企业提高销售额,让消费者受益。亚马逊网站上列出了数以百万计的产品,用户在浏览和查找要购买的产品时很可能会遇到问题。有了推荐系统,消费者可以轻松找到产品,提高易用性,迫使消费者继续使用网站而不是离开。
推荐系统如何工作?
推荐系统是一种数据过滤引擎,它使用深度学习概念和算法,根据以往的偏好或二次过滤,推荐潜在的产品。
这类算法背后的概念是发现消费者或类似消费者对服务或产品的行为模式。
收集数据的方法因销售的产品或服务类型不同而大相径庭。例如,电子商务网站收集的数据是评论等级,而 Youtube 会保存喜欢和不喜欢的视频。
推荐系统生命周期
有些推荐系统比其他系统复杂得多,但许多系统都遵循七步路径来开发成功的推荐模型:
- 收集数据:识别并收集与推荐系统相关的数据。例如,亚马逊可以收集评论和产品评级(5 星级评级系统),而 Netflix 商店则可以观看、点赞和添加书签的节目和电影。
- 存储收集的数据:将数据存储在专有数据仓库中。或者利用亚马逊、谷歌、MongoDB等第三方云服务提供商来提高效率和数据检索速度。
- 过滤数据:过滤数据集中有问题的值(空值、无限值或误导性值)以提高模型准确性。
- 分析数据:就推荐系统而言,分析数据意味着将其输入机器学习或深度学习算法,这些算法可以检测隐藏的见解和模式。
- 评估和测试我们的模型:检查推荐系统模型的性能。如果模型表现不佳,请将超参数调整到所需的性能。
- 部署我们的模型:您的模型已准备好部署到实际实践中。继续监控和调整系统。
- 在线机器学习:部署后的在线机器学习可以通过学习新获取的数据来不断改进和调整模型,保持长寿。
推荐系统算法
矩阵和深度学习是构建推荐系统的方法。其中矩阵是基于逻辑的系统
- 聚类:一种无监督机器学习算法,可以返回良好的预测结果。在大多数情况下,仅靠聚类不足以构建高级推荐引擎。
- 深度学习:一种更复杂的分析方法,将消费者的行为模式作为输入,并过滤出与每个用户最相关的建议。
使用推荐系统的好处
- 增加销售额:公司投资此类系统的首要原因是为了创收。通过推荐系统增加销量还可以提高消费者在其网站上的参与度并获得更长的会话时间。
- 降低系统负载:由于系统确实为每个给定用户过滤了最匹配的项目,因此推荐系统可以提高销售额,同时保持较低的系统负载并从长远来看降低成本。
- 提高参与度和满意度:通过不断为消费者提供无穷无尽的个性化产品,消费者将继续与应用程序/网站互动。推荐系统优化体验,减少浪费的页面空间,从而提高对相关内容的满意度。
推荐系统的类型
根据企业提供的产品或服务,可能会采用不同的推荐系统。不同系统的一些示例是:
协同过滤
协同过滤方法关注不同用户和项目之间的相似性。具有相似兴趣的消费者很可能会对其他类似产品感兴趣。这些相似之处可以改善对数据集中所有用户的推荐,并随着新产品进入市场而继续学习。
例如,如果亚历克斯喜欢足球并买了一双球鞋,而梅格喜欢足球,那么梅格很可能也会对这些球鞋感兴趣。
协同过滤有多种类型:
- 用户到产品过滤是所有过滤方法中最简单的,其中算法将查找消费者之前购买或喜欢的类似商品。类型、价格、商品类别等都是影响过滤的类别。
- 用户到用户过滤的工作原理是找到具有相似兴趣的消费者,并根据相似用户的选择推荐产品和服务。这种算法需要高计算能力和资源,因为该算法需要实时比较所有用户。
基于内容的过滤
基于内容的过滤推荐算法评估产品的相似度。推荐系统会向之前互动过的用户推荐类似分类的产品。
例如,如果最近观看的三部电影包括喜剧类型,系统将推荐其他类似的喜剧电影或节目。对于使用图像处理或自然语言处理来匹配外观、标题或描述相似的商品的产品图像,此类推荐也是必不可少的。
请注意,基于相似性的推荐将受到冷启动问题的影响。当没有足够的偏好数据时,就会出现冷启动问题。当最初在平台上实施时,推荐系统无法准确地推荐好的选项,因为它需要时间来收集和训练。
混合过滤
混合过滤同时利用协作过滤和基于内容的过滤,利用彼此的优势。
几项将混合过滤系统与单独的协作和内容系统的性能进行比较的研究表明,混合系统具有更好的准确性。
结合这两种算法可以消除冷启动问题等多个问题,并有助于快速收集数据。我们最喜欢的许多网站(例如 Google、Youtube 和 Netflix)在其推荐系统中都使用了混合过滤。
现实生活中的推荐系统示例
亚马逊
亚马逊上有数以百万计的产品,消费者可能会被他们想买的东西分散注意力;产品种类的增加将导致消费者决策时间的增加。
亚马逊推荐系统过滤可能的商品,以帮助消费者找到满意的产品。
Spotify
Spotify 会评估用户喜欢听哪些歌曲,并相应地推荐新音乐。他们还策划了一个每周发现播放列表,供用户发现新的但熟悉的音乐。
Spotify 的混合过滤算法可帮助听众通过了解他们的喜好、厌恶和细微差别来发现新音乐。
脸书/元数据
Facebook 还在其应用程序中使用了多种推荐系统。这些引擎根据喜欢、不喜欢、共同的朋友等推荐下一篇文章、朋友建议和广告位置。
与前面提到的公司一样,Facebook 的收入与其推荐系统的有效性直接相关。
Netflix
Netflix 因其广泛使用推荐系统而闻名。 Netflix 上超过 80% 的观看内容来自算法建议,他们的推荐系统每年估计会产生 10 亿美元的收入。
此外,新的 Netflix 帐户将对热门节目和电影进行评分,以帮助推荐算法预测新节目,以避免冷启动问题。
谷歌和 YouTube
作为最受欢迎的搜索引擎和浏览器之一,谷歌花费巨资尽可能更新其推荐系统的效率和准确性。
在搜索引擎中,谷歌会根据最近的搜索生成自动填充结果,帮助用户找到他们正在寻找的内容,提高用户满意度。
Google 还在 Youtube 上部署推荐系统,通过使用视图、点赞、共享视频、订阅、流派等过滤器实施个人建议和评级系统。 YouTube 还利用流行度建议来生成热门视频的观看次数。
谷歌广告产生了很大一部分收入。 Google 存储行为数据,例如购买、观看的 Youtube 视频和搜索,以便向用户提供和推荐与产品和服务相匹配的广告。
关于推荐系统的最终想法
协作过滤、基于内容的过滤和混合模型推荐引擎是任何人都可以开始使用这个出色工具的高级基础方法。通过对系统的总体概述,构建推荐系统时需要记住的因素包括:
- 如何跟踪建议的有效性
- 在消费者停止与产品互动后何时停止向其推荐产品
- 如何衡量具有较高评论或观看次数的产品
- 推荐会动态变化吗?系统会回溯多远?
- 推荐系统可能会无意中将消费者分为一个小类别。您的算法如何向消费者推荐不同但有效的内容?
许多企业每天都在利用和改进推荐系统。这些算法将继续开发并用于越来越多的应用。此类系统为消费者和组织都带来好处;如果有效使用,它们可以成为任何想要向消费者提供满意的产品和建议的公司必不可少的销售工具。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)