【7417】-Spark2.x+协同过滤算法，开发企业级个性化推荐系统

Spark2.x+协同过滤算法，开发企业级个性化推荐系统

第1章课程介绍与学习指南

本节主要进行课程的介绍，学习路线与指南，如何更好的学习本课程？为什么要学习本课程，学习本课程具体能收获什么？

1-1 课程介绍及导学

1-2 怎么更好的使用慕课平台

1-3 你真的会问问题吗？

第2章了解推荐系统的生态

本章带你了解推荐系统的生态，让你从思维上重塑对推荐系统的认知。了解推荐系统是由哪些关键元素支撑的，推荐算法的分类以及什么才算一个好的推荐系统

2-1 推荐系统的关键元素和思维模式

2-2 推荐算法的主要分类

2-3 推荐系统常见的问题

2-4 推荐系统效果评测

第3章给学习算法打基础

本章回顾并梳理了学习算法必需的数学知识和统计学知识，帮助大家巩固基础，平滑过渡，为后面学习推荐算法做铺垫。

3-1 推荐系统涉及的数学知识

3-2 推荐系统涉及的概率统计知识

第4章详解协同过滤推荐算法原理

本章介绍推荐算法中最常用也最受欢迎的协同过滤推荐算法。首先巩固学习协同过滤特有的数学基础，然后分别从推荐算法的三个类型：基于用户，基于物品，基于模型来展开，并且对它们进行代码演示。

4-1 本章作业

4-2 协同过滤的数学知识：最小二乘法

4-3 协同过滤的数学知识：梯度下降法

4-4 协同过滤的数学知识：余弦相似度

4-5 什么是user-based的协同过滤

4-6 基于Spark实现user-based协同过滤

4-7 什么是item-based协同过滤

4-8 基于Spark实现item-based协同过滤

4-9 基于模型的协同过滤

4-10 基于矩阵分解模型的两种算法：SVD和PMF

4-11 缺失值填充

第5章 Spark内置推荐算法ALS原理

本章讲解Spark内置的推荐算法：ALS。从算法原理、Spark上实现、源码阅读，这3个方面全面讲解ALS算法。

5-1 ALS 算法原理

5-2 ALS 算法在Spark上的实现

5-3 ALS 算法在 Spark 上的源码分析

第6章推荐系统搭建——需求分析和环境搭建

开始进行推荐系统的实操了！大家准备好了吗？这章我们进行对整个推荐系统做一个需求分析。并且手把手带领环境搭建。

6-1 本章重点难点提点

6-2 项目需求分析技术分解模块设计

6-3 开发环境搭建

6-4 环境问题工具问题版本问题

6-5 【实操手册】环境搭建文档 ( 完善版 )

第7章推荐系统搭建——UI界面模块

先从简单内容起步，一般大数据开发工程师主要负责数据的收集和分析，这里为了演示方便我们制作了简单的前端页面，使用了 VUE、Element-UI和EChatrs

7-1 VUE+ElementUI简单入门

7-2 用户访问页面实现

7-3 AB Test 控制台页面（上）

7-4 AB Test 控制台页面（下）

第8章推荐系统搭建——数据层

做好前期准备，终于步入正轨了，大家是不是都按耐不住了？本章将带领大家开发项目的数据层的部分，分别实现数据采集、清洗、分析等功能。

8-1 数据上报（上）

8-2 数据上报（下）

8-3 日志清洗和格式化数据（上）

8-4 日志清洗和格式化数据（中）

8-5 日志清洗和格式化数据（下）

8-6 分析用户行为和商品属性

第9章推荐系统搭建——推荐引擎

本章将要介绍本次项目的重难点，推荐引擎模块的搭建。主要讲解推荐模块的几个核心：召回，过滤，特征计算和排序。逐步完成实时推荐架构的搭建。

9-1 基于用户行为构建评分矩阵

9-2 离线推荐：基于用户角度召回策略筛选候选集（上）

9-3 离线推荐：基于用户角度召回策略筛选候选集（下）

9-4 离线推荐：基于物品角度召回策略筛选候选集（上）

9-5 离线推荐：基于物品角度召回策略筛选候选集（下）

9-6 离线推荐：写特征向量到HBase

9-7 离线推荐：基于模型的排序

9-8 实时推荐：Storm解析用户行为

9-9 实时推荐：通过FTRL更新特征权重-原理

9-10 实时推荐：通过FTRL更新特征权重-代码实现

9-11 离线推荐和实时推荐项目梳理

第10章推荐系统搭建——推荐结果存储

本章演示个性化推荐系统的评估模块的搭建。主要是介绍主流的测试模块A/B测试，逐步开发搭建一个完整的A/B测试后台

10-1 数仓ODS和DWD层搭建

10-2 搭建用户行为日志数据仓库

10-3 利用外部分区表存储用户行为

第11章推荐系统搭建——推荐效果评估模块

本章演示个性化推荐系统收尾环节，评估模块的搭建。主要介绍主流的测试模块A/BTest，逐步搭建一个完整的A/B测试后台

11-1 AB Test

11-2 AB Test的分流管理

11-3 搭建AB Test 实验控制台（上）

11-4 搭建AB Test 实验控制台（下）

11-5 常用评测指标

第12章知识拓展——基于关联规则的推荐算法

本章讲解两个主要的关联规则推荐算法，Apriori和FP-Growth，并通过Spark去演示这两个算法的实现。

12-1 基于Apriori的关联算法

12-2 基于Spark实现Apriori算法（上）

12-3 基于Spark实现Apriori算法（下）

12-4 基于FP-Growth的关联算法

12-5 基于Spark实现FP-Growth算法

第13章知识拓展——基于机器学习的推荐算法

本章主要讲解主流的基于机器学习的推荐算法。首先介绍RBM随机网络原理，接着分别展示基于 RBN、CNN、RNN的推荐算法，演示如何实现。

13-1 RBM神经网络

13-2 CNN卷积神经网络

13-3 RNN循环神经网络

第14章知识拓展——基于内容的推荐算法

本章主要介绍主流的基于内容的推荐算法，分别介绍TF-IDF算法、文本向量化、用户行为向量化和长期模型。最后对所有算法知识以及课程项目进行一个总结和展望。

14-1 文本向量化

14-2 基于Spark实现TF-IDF

14-3 课程总结

本课程已完结

返回列表