一个通俗易懂的开源推荐系统(A user-friendly open-source project for recommendation systems).
本项目将结合:代码、数据流转图、博客、模型发展史 等多个方面通俗易懂地讲解经典推荐模型,让读者通过一个项目了解推荐系统概况!
持续更新中..., 欢迎star🌟, 第一时间获取更新!!!
1️⃣ 分类解析推荐模型:特征交叉模型、多任务模型、行为序列模型等
2️⃣ 通过blog详细解释模型/论文
3️⃣ 提供模型发展图:介绍模型的优缺点,解决了什么问题,以及前后因果关系
4️⃣ 提供详细的代码注释,并包含详细的数据处理模块
(图片展示有水印,望理解,后期会使用markdown语法编辑!)和很多朋友交流发现,我们在读很多论文时,都聚焦于论文中提出的模型本身,而没有关心模型间的因果关系,所以这个 板块用来介绍模型优缺点和模型间的前后因果关系。
由于很多论文中都没有显式介绍自己模型的优缺点和前因后果,所以很多观点都是本人结合网上资料加上个人理解作出的,如果有不对的地方,欢迎在issue中交流讨论。
Name | Preprocess_url | Download | Progress |
---|---|---|---|
Criteo | criteo_preprocess.py: 预处理源代码 | Download_URL | ✅ |
预处理说明 |
No. | Publication | Model | Blog | Paper | Version |
---|---|---|---|---|---|
1 | DLRS'16 | WideDeep | 📝 白话WideDeep | Wide & Deep Learning for Recommender Systems, Google | ✅torch |
2 | ADKDD'17 | DCN | 📝 白话DCN | Deep & Cross Network for Ad Click Predictions, Google | ✅torch |
3 | WWW'21 | DCV-v2 | DCN V2: Improved Deep & Cross Network and Practical Lessons for Web-scale Learning to Rank Systems, Google | ✅torch |
本项目环境主要有:
- python=3.8.20
- pytorch=1.13.0
其余安装包可以使用下面命令安装:
pip install -r requirements.txt
以Criteo数据集和WideDeep举例:
Step1: 数据预处理
cd DataProcess/criteo
python criteo_preprocess.py
样本数据是使用的Criteo一万条数据作为示例,在执行命令过程中,需要注意 数据集的路径
Step2: 训练模型
在 data_config.json 中配置数据集路径;
在 model_config.json 中配置模型信息;
然后运行下面命令即可:
cd ModelZoo/WideDeep/WideDeep_torch
python train.py
开源项目的一个很大特点就是:共创!
欢迎各位在issue中交流讨论。
如果你觉得还不错的话,请帮忙点个star🌟吧,非常感谢!!! If you think it's good, please help out with a star🌟, thank you !!!