9787111558804: Python机器学习

Synopsis

机器学习与预测分析正在改变企业和其他组织的运作方式,本书将带领读者进入预测分析的世界。全书共13章,除了简要介绍机器学习及Python在机器学习中的应用,还系统讲述了数据分类、数据预处理、模型优化、集成学习、回归、聚类、神经网络、深度学习等内容。本书将机器学习背后的基本理论与应用实践联系起来,通过这种方式让读者聚焦于如何正确地提出问题、解决问题。本书讲解了如何使用Python的核心元素以及强大的机器学习库,同时还展示了如何正确使用一系列统计模型。本书可作为学习数据科学的初学者及想进一步拓展数据科学领域认识的读者的参考书。同样,本书也适合计算机等相关专业的本科生、研究生阅读。译者序推荐序作者简介审校者简介前言第1章赋予计算机学习数据的能力11.1构建智能机器将数据转化为知识11.2机器学习的三种不同方法11.2.1通过监督学习对未来事件进行预测21.2.2通过强化学习解决交互式问题41.2.3通过无监督学习发现数据本身潜在的结构41.2.4基本术语及符号介绍51.3构建机器学习系统的蓝图61.3.1数据预处理61.3.2选择预测模型类型并进行训练71.3.3模型验证与使用未知数据进行预测81.4Python在机器学习中的应用8本章小结9第2章机器学习分类算法102.1人造神经元—早期机器学习概览102.2使用Python实现感知器学习算法132.3自适应线性神经元及其学习的收敛性192.3.1通过梯度下降最小化代价函数202.3.2使用Python实现自适应线性神经元212.3.3大规模机器学习与随机梯度下降25本章小结29第3章使用scikit-learn实现机器学习分类算法303.1分类算法的选择303.2初涉scikit-learn的使用30使用scikit-learn训练感知器313.3逻辑斯谛回归中的类别概率343.3.1初识逻辑斯谛回归与条件概率343.3.2通过逻辑斯谛回归模型的代价函数获得权重363.3.3使用scikit-learn训练逻辑斯谛回归模型373.3.4通过正则化解决过拟合问题393.4使用支持向量机最大化分类间隔413.4.1对分类间隔最大化的直观认识413.4.2使用松弛变量解决非线性可分问题423.4.3使用scikit-learn实现SVM443.5使用核SVM解决非线性问题443.6决策树483.6.1最大化信息增益—获知尽可能准确的结果493.6.2构建决策树523.6.3通过随机森林将弱分类器集成为强分类器533.7惰性学习算法—k-近邻算法54本章小结57第4章数据预处理—构建好的训练数据集584.1缺失数据的处理584.1.1将存在缺失值的特征或样本删除594.1.2缺失数据填充604.1.3理解scikit-learn预估器的API604.2处理类别数据614.2.1有序特征的映射614.2.2类标的编码624.2.3标称特征上的独热编码634.3将数据集划分为训练数据集和测试数据集644.4将特征的值缩放到相同的区间654.5选择有意义的特征664.5.1使用L1正则化满足数据稀疏化674.5.2序列特征选择算法704.6通过随机森林判定特征的重要性74本章小结76第

"synopsis" may belong to another edition of this title.