本书从逻辑上可分为两大部分。
第一部分是Python编程基础(第1~4章),介绍了Python环境搭建、Python基础语法、控制语句、函数、面向对象编程等。第1章旨在让读者从全局把握Python,了解利用Python进行智能数据分析的优势,并详细介绍了Python环境搭建与配置,同时还对两个常用集成开发环境做了详细介绍。第2章先对Python固定语法做了介绍,包括编码声明、注释、缩进等;而后介绍了Python常见的数据类型,包括str、list、tuple、dict、set等;还介绍了Python常用运算符,包括算术运算符、逻辑运算符、成员运算符、位运算符等。第3章主要对控制语句做了详细介绍,包括条件语句和循环语句,同时还介绍了和条件语句类似的异常处理try-except-else语句。第4章主要介绍了Python的内置函数、自定义函数、面向对象编程以及第三方库的安装与使用方法。
第二部分是数据分析编程(第5~9章),主要对数据分析中常用的第三方库做了详细介绍,强调在Python中对应函数的使用方法及其结果的解释说明。内容涵盖数值分析库NumPy,数据处理库pandas,绘图库Matplotlib、Seaborn、Bokeh,机器学习与数据分析建模库scikit-learn。这一部分涉及数据读取、数据预处理、模型构建、模型评价、结果可视化,几乎涵盖了整个数据分析过程,充分而又详细地说明了Python数据分析的常用操作,相信在本书的指导下,读者能够从零开始快速数据入门分析。
本书共16章,分三个部分:基础篇、实战篇、提高篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。高级篇介绍了基于R语言二次开发的数据挖掘应用软件,使读者体验到数据挖掘二次的开发的魅力
本书是Python数据分析与挖掘领域的公认的事实标准,第1版销售超过10万册,销售势头依然强劲,被国内100余所高等院校采用为教材,同时也被广大数据科学工作者奉为经典。
作者在大数据挖掘与分析等领域有10余年的工程实践、教学和创办企业的经验,不仅掌握行业的新技术和实践方法,而且洞悉学生和老师的需求与痛点,这为本书的内容和形式提供了强有力的保障,这是本书第1版能大获成功的关键因素。
全书共13章,分为三个部分,从技术理论、工程实践和进阶提升三个维度对数据分析与挖掘进行了详细的讲解。
第一部分 基础篇(第1~5章)
主要讲解了Python数据分析与挖掘的工具和技术理论,包括数据挖掘的基础知识、Python数据挖掘与建模工具、数据挖掘的建模过程,以及挖掘建模的常用算法和原理等内容。
第二部分 实战篇(第6~12章)
通过工程实践案例讲解了数据挖掘技术在金融、航空、零售、能源、制造、电商等行业的应用。在案例组织结构上,本书按照“介绍案例背景与挖掘目标→阐述分析方法与过程→完成模型构建”的顺序进行,在建模过程关键环节,穿插程序实现代码。最后,通过上机实践加深对案例应用中的数据挖掘技术的理解。
第三部分 提高篇(第13章)
重点讲解了基于Python引擎的开源数据挖掘建模平台(TipDM)的功能和使用方法,以航空公司客户价值分析为案例,介绍了如何使用该平台快速搭建数据分析与挖掘工程。
本书不仅提供TipDM这样的上机实践环境,而且还提供配套的案例建模数据、Python源代码、教学PPT。
本站基于Calibre构建,感谢开源界的力量。所有资源搜集于互联网,如有侵权请邮件联系。
Github | Docker | Project
本书从逻辑上可分为两大部分。
第一部分是Python编程基础(第1~4章),介绍了Python环境搭建、Python基础语法、控制语句、函数、面向对象编程等。第1章旨在让读者从全局把握Python,了解利用Python进行智能数据分析的优势,并详细介绍了Python环境搭建与配置,同时还对两个常用集成开发环境做了详细介绍。第2章先对Python固定语法做了介绍,包括编码声明、注释、缩进等;而后介绍了Python常见的数据类型,包括str、list、tuple、dict、set等;还介绍了Python常用运算符,包括算术运算符、逻辑运算符、成员运算符、位运算符等。第3章主要对控制语句做了详细介绍,包括条件语句和循环语句,同时还介绍了和条件语句类似的异常处理try-except-else语句。第4章主要介绍了Python的内置函数、自定义函数、面向对象编程以及第三方库的安装与使用方法。
第二部分是数据分析编程(第5~9章),主要对数据分析中常用的第三方库做了详细介绍,强调在Python中对应函数的使用方法及其结果的解释说明。内容涵盖数值分析库NumPy,数据处理库pandas,绘图库Matplotlib、Seaborn、Bokeh,机器学习与数据分析建模库scikit-learn。这一部分涉及数据读取、数据预处理、模型构建、模型评价、结果可视化,几乎涵盖了整个数据分析过程,充分而又详细地说明了Python数据分析的常用操作,相信在本书的指导下,读者能够从零开始快速数据入门分析。