最全的推荐系统数据下载链接,包括社交网络

1.电影推荐数据集(社交数据集)

  • FilmTrust

       该数据集是2011年6月从FilmTrust网站上抓取的一个小型数据集。包含用户对电影的评分信息和用户间的社交信息。数据量较小,只有35497条评分数据。1853条社交数据。

 下载链接:https://github.com/guoguibing/librec/tree/3.0.0/data/filmtrust

  • Epinions

        该数据集规模较大,包含用户对电影的评分信息和用户间的社交信息。该数据集有两个版本,其中一个版本还包括了用户间的不信任关系信息。

下载链接:http://www.trustlet.org/epinions.html

  • CiaoDVD

        该数据集包含了用户对他们购买过的项目的评分和用户间的社交连接。该数据集从dvd.ciao.co.中抓取的2013年12月英国网站整个dvd类别的数据集。

下载链接:Datasets

  • 豆瓣电影

        这是一个匿名的豆瓣数据集,包含129,490个独立用户和58,541个独立电影条目。

下载链接:pub:data:douban [Irwin King @ Web Intelligence & Social Computing Lab]

  • Flixster

        Flixster是一个社交电影网站,允许用户分享电影评级,发现新电影,并与其他有类似电影品味的人见面。

下载链接:​​​​​​https://www.heywhale.com/mw/dataset/5db94936080dc300371e5cb0

                   http://socialcomputing.asu.edu/datasets/Flixster

  • MovieLens

MovieLens数据集包含多个用户对多部电影的评级数据,也包括电影元数据信息和用户属性信息。

下载链接:MovieLens | GroupLens

  • Recommender Systems and Personalization Datasets

下载链接:Recommender Systems Datasets

2.美味推荐数据集

  • Delicious

        此数据集包含来自Delicious社交书签系统的用户间的社交网络,书签和标签信息。

下载链接:HetRec 2011 | GroupLens

3.其他推荐数据集

  • Yelp数据集

        该数据集是用于个人、教育和学术目的的业务、评论和用户数据的子集。可以在JSON和SQL文件中使用,在你学习如何制作移动应用程序时,可以使用它来教学生关于数据库、学习NLP或示例生产数据。该数据集规模较大,需要手动提取相关信息。

下载链接:Yelp Dataset

  • AmazonReviews数据集

        该数据集包含来自Amazon的产品评论和元数据,包括1996年5月至2014年7月期间的1.428亿个评论。这个数据集包括评论(评级、文本、帮助投票)、产品元数据(描述、类别信息、价格、品牌和图像特性)和链接(也查看/购买图表)。该数据集规模较大,需要手动提取相关信息。

下载链接:http://jmcauley.ucsd.edu/data/amazon/ 

  • 图书推荐数据集BookCrossing

下载链接:http://www2.informatik.uni-freiburg.de/~cziegler/BX/ 

  • 小丑在线笑话推荐数据集Jester

下载链接: Jester Datasets

  • Bibsonomy

社交书签系统中的标签推荐

下载链接:BibSonomy Dataset :: dumps for research purposes

  • 淘宝购物数据集(天池)

  下载链接: https://tianchi.aliyun.com/dataset/dataDetail?dataId=1

  • 其他数据集下载链接:

1.推荐系统数据集大列表 - 程序员大本营https://www.pianshen.com/article/18991225347/

2.深度学习技术在社会化推荐场景中的总结(附数据集)_m0_37586850的博客-CSDN博客前言不知道大家有没有感觉,在日常生活中用到推荐一词的时候经常是用在社交场景中的。到一个地方旅游让朋友推荐一下旅游景点,学习某一项技术的时候让朋友推荐一些有什么书可以看。在众多推荐系统的方...https://blog.csdn.net/m0_37586850/article/details/109281724

3.推荐领域数据集 - huangshanshan - 博客园http://www.grouplens.org/taxonomy/term/14Movielens Dataset:其中Movielens-100k和movielens-1M有用户对电影的打分,电影https://www.cnblogs.com/startover/p/3261476.html

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐