基于集成学习方法的电商平台推荐系统.pdf

上传人:刘** 文档编号:11457434 上传时间:2021-09-27 格式:PDF 页数:6 大小:275.27KB
收藏 版权申诉 举报 下载
基于集成学习方法的电商平台推荐系统.pdf_第1页
第1页 / 共6页
基于集成学习方法的电商平台推荐系统.pdf_第2页
第2页 / 共6页
基于集成学习方法的电商平台推荐系统.pdf_第3页
第3页 / 共6页
文档描述:

《基于集成学习方法的电商平台推荐系统.pdf》由会员分享,可在线阅读,更多相关《基于集成学习方法的电商平台推荐系统.pdf(6页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910203243.8 (22)申请日 2019.03.18 (71)申请人 广东工业大学 地址 510062 广东省广州市大学城外环西 路100号 (72)发明人 周伟坤谢胜利邓一术杜戈 张仕雄 (74)专利代理机构 广东广信君达律师事务所 44329 代理人 杜鹏飞杨晓松 (51)Int.Cl. G06F 16/215(2019.01) G06K 9/62(2006.01) G06N 20/20(2019.01) G06Q 30/02(2012.01) G06Q 30/。

2、06(2012.01) (54)发明名称 一种基于集成学习方法的电商平台推荐系 统 (57)摘要 本发明公开了一种基于集成学习方法的电 商平台推荐系统, 包括下述步骤: 步骤一, 采集电 商用户行为的数据集, 将电商用户的购物行为分 成若干个字段; 步骤二, 异常值剔除; 步骤三, 特 征筛选; 本发明的训练模型部分使用了集成学习 方法, 即是多个单一推荐模型的算法通过改进的 bagging和boosting进行模型集成, 紧接着进行 stacking模型融合, 这种方法能够有效的降低电 商推荐模型的错误率, 而且该技术不需要有稠密 的电商行为数据, 也不需要用户对商品进行打 分, 这不仅更加。

3、符合现实生活中电商平台用户行 为的稀疏性, 而且这种电商用户行为是隐性存在 的, 从而提高了推荐评价指标的精确率, 给电商 平台带来更高的效益。 权利要求书1页 说明书3页 附图1页 CN 110109902 A 2019.08.09 CN 110109902 A 1.一种基于集成学习方法的电商平台推荐系统, 其特征在于, 包括下述步骤: 步骤一, 采集电商用户行为的数据集, 将电商用户的购物行为分成若干个字段; 步骤二, 异常值剔除; 步骤三, 特征筛选; 筛选电商用户行为特征, 由于原始数据无法直接用于建模, 因此需 要将其归纳为统计特征; 特征的筛选需要能够充分描述商品信息、 电商用户信。

4、息以及电商 用户-商品的交互情况; 步骤四, 样本划分; 划分样本数据, 由于数据总量较大, 在处理过程中仅使用部分样本 进行建模; 步骤五, 集成学习方法分类建模; 使用不同的集成学习方法对电商用户行为分析分类 建模; 其中, 所述集成学习方法可分为xgboost算法模型、 catboost算法模型和lightbgm算法 模型, 然后将这些集成学习方法通过模型融合组成在一起; 步骤六, 通过预测结果个性化地向电商用户推荐商品。 权利要求书 1/1 页 2 CN 110109902 A 2 一种基于集成学习方法的电商平台推荐系统 技术领域 0001 本发明涉及电商平台推荐技术领域, 具体涉及一。

5、种基于集成学习方法的电商平台 推荐系统。 背景技术 0002 传统的电商推荐系统大多数使用单一模型训练电商行为特征工程, 这种单一模型 无法结合其他模型的优点, 若预处理效果不妥当, 只能更加暴露该单一模型的缺点, 造成后 面预测分析的准确率过低。 在电商平台中, 推荐平台收益部分会降低。 现有技术中, 专利 CN201611254081.3公开了基于逻辑回归进行构造训练特征工程, 这种模型对训练特征中自 变量多重共线性较为敏感, 导致很多区间的变量变化对目标概率的影响没有区分度, 无法 确定阀值; 专利CN201810332332.8公开了基于协同过滤的物品推荐方法, 物品推荐只能在 稠密数。

6、据才能有明显的效果, 并且用户要对商品物品打分, 而且模型训练比较费时, 不具有 很好的可解释性; 同时分解出来的用户和物品矩阵的每个维度无法和现实生活中的概念来 解释, 无法用现实概念给每个维度命名, 只能理解为潜在语义空间; 而且存在针对现有的用 户行为数据过于稀疏, 缺乏用户对商品评分等客观条件, 协同过滤等经典算法的效果较差 的问题。 发明内容 0003 本发明的目的在于克服现有技术的缺点与不足, 提供一种基于集成学习方法的电 商平台推荐系统, 该系统通过采集电商用户行为的数据集, 把用户的购物行为分成若干个 字段, 把异常值剔除、 特征筛选、 样本划分, 最后通过集成学习方法分类建模。

7、, 通过预测结果 能够个性化地向用户推荐商品, 提高用户的购物效率, 促成更多交易, 提高电商平台的营业 收入。 0004 本发明的目的通过下述技术方案实现: 0005 一种基于集成学习方法的电商平台推荐系统, 包括下述步骤: 0006 步骤一, 采集电商用户行为的数据集, 将电商用户的购物行为分成若干个字段; 0007 步骤二, 异常值剔除; 0008 步骤三, 特征筛选; 筛选电商用户行为特征, 由于原始数据无法直接用于建模, 因 此需要将其归纳为统计特征; 特征的筛选需要能够充分描述商品信息、 电商用户信息以及 电商用户-商品的交互情况; 0009 步骤四, 样本划分; 划分样本数据, 。

8、由于数据总量较大, 在处理过程中仅使用部分 样本进行建模; 0010 步骤五, 集成学习方法分类建模; 使用不同的集成学习方法对电商用户行为分析 分类建模; 0011 其中, 所述集成学习方法可分为xgboost算法模型、 catboost算法模型和lightbgm 算法模型, 然后将这些集成学习方法通过模型融合组成在一起; 说明书 1/3 页 3 CN 110109902 A 3 0012 步骤六, 通过预测结果个性化地向电商用户推荐商品。 0013 本发明与现有技术相比具有以下的有益效果: 0014 本发明的训练模型部分使用了集成学习方法, 即是多个单一推荐模型的算法通过 改进的baggi。

9、ng和boosting进行模型集成, 紧接着进行stacking模型融合, 这种方法能够有 效的降低电商推荐模型的错误率, 而且该技术不需要有稠密的电商行为数据, 也不需要用 户对商品进行打分, 这不仅更加符合现实生活中电商平台用户行为的稀疏性, 而且这种电 商用户行为是隐性存在的, 从而提高了推荐评价指标的精确率, 给电商平台带来更高的效 益。 附图说明 0015 图1为本发明的流程图。 具体实施方式 0016 下面结合实施例及附图对本发明作进一步详细的描述, 但本发明的实施方式不限 于此。 0017 如图1所示, 一种基于集成学习方法的电商平台推荐系统, 包括下述步骤: 0018 步骤一,。

10、 采集电商用户行为的数据集, 将电商用户的购物行为分成若干个字段。 0019 步骤二, 异常值剔除; 异常值的存在通常会严重影响建模和预测质量, 因此有必要 对数据中存在的异常值进行剔除。 0020 步骤三, 特征筛选; 筛选电商用户行为特征, 由于原始数据无法直接用于建模, 因 此需要将其归纳为统计特征; 特征的筛选需要能够充分描述商品信息、 电商用户信息以及 电商用户-商品的交互情况。 0021 步骤四, 样本划分; 划分样本数据, 由于数据总量较大, 在处理过程中仅使用部分 样本进行建模。 0022 步骤五, 集成学习方法分类建模; 使用不同的集成学习方法对电商用户行为分析 分类建模。 。

11、0023 其中, 所述集成学习方法可分为xgboost算法模型、 catboost算法模型和lightbgm 算法模型, 然后将这些集成学习方法通过模型融合组成在一起; Boosting是一种非常有效 的集成学习算法, 采用Boosting方法可以将弱分类器转化为强分类器, 从而达到准确的分 类效果。 这类Boosting方法使用了xgboost、 catboost和lightgbm结合起来一起使用, 是为 了方便下一步的stacking模型融合。 在模型融合阶段, 通过不同的电商用户行为数据划分 不同的K折交叉验证, 进一步提高了电商推荐系统的准确率。 0024 步骤六, 通过预测结果个性化。

12、地向电商用户推荐商品。 0025 进一步来说, 本发明首先针对梯度提升决策树易于过拟合且训练速度慢的问题, 提出了解决方案并在其中主要做了四个工作: (1)提出了一种基于模型参数的复杂度的正 则化方法, 来降低boosting的过拟合的程度; (2)提出了一种基于牛顿法思想的优化方法, 用该方法替代现有的梯度下降寻优方式; (3)提出了一种基于梯度提升决策树的单一模型, 通过不同的梯度下降方式构造成不同的集成学习方法, 例如改进的xgboost、 catboost和 lightbgm等; (4)提出了一种基于集成学习方法模型融合的迭代方法。 说明书 2/3 页 4 CN 110109902 A。

13、 4 0026 本发明的训练模型部分使用了集成学习方法, 即是多个单一推荐模型的算法通过 改进的bagging和boosting进行模型集成, 紧接着进行stacking模型融合, 这种方法能够有 效的降低电商推荐模型的错误率, 而且该技术不需要有稠密的电商行为数据, 也不需要用 户对商品进行打分, 这不仅更加符合现实生活中电商平台用户行为的稀疏性, 而且这种电 商用户行为是隐性存在的, 从而提高了推荐评价指标的精确率, 给电商平台带来更高的效 益。 0027 上述为本发明较佳的实施方式, 但本发明的实施方式并不受上述内容的限制, 其 他的任何未背离本发明的精神实质与原理下所作的改变、 修饰、 替代、 组合、 简化, 均应为等 效的置换方式, 都包含在本发明的保护范围之内。 说明书 3/3 页 5 CN 110109902 A 5 图1 说明书附图 1/1 页 6 CN 110109902 A 6 。

展开阅读全文
内容关键字: 基于 集成 学习方法 平台 推荐 系统
关于本文
本文标题:基于集成学习方法的电商平台推荐系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11457434.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1 
 


收起
展开