阅读

Spark机器学习进阶实战

马海平,于俊,吕昕,向海著,2018年版

科大讯飞大数据专家团队撰写

不囿于Spark机器学习库

突出工程化思维与实战

本书分为三大部分:

基础篇(1-2章)对Spark机器学习机型概述、并通过Spark机器学习开始进行数据分析

算法篇(3-8章)针对聚类、分类、回归、协同过滤、关联规则、降维等算法进行详细讲解,并进行案例支持

综合案例篇(9-12章)重点通过异常检测、用户画像、广告点击率预估、智慧交通大数据4个综合场景,详细讲解基于Spark机器学习的综合应用

Github | Docker | Project