编辑推荐
null
内容简介
苏尼拉·格拉普蒂著的《实用机器学习/数据科学与工程技术丛书》探索了一系列广泛应用的机器学习技术,用实际例子揭示常见数据中隐藏的处理技巧。虽然机器学习是高度理论性的,但是本书提供了一种令人耳目一新的实操方法,同时也没有忽略底层原理。 本书涵盖当前领先的数据科学语言(如Python和R)、被低估但非常强大的Julia,以及一系列大数据平台(包括Spark、Hadoop和Mahout等)。实用的机器学习技术是现代数据科学家掌握机器学习应用的重要资源。 本书还探讨了机器学习的前沿进展,提供了一些关于深度学习和强化学习的范例和指导原则,完美演绎实操过程及算法原理。
作者介绍
关 于 作 者Sunila Gollapudi 担任Broadridge金融解决方案(印度)有限公司的技术副总裁。该公司是美国Broadridge金融解决方案公司的全资子公司(BR)。她在IT服务领域拥有14年的丰富实践经验。她目前负责印度卓越架构中心,是大数据和数据科学计划的领军人物。 加入Broadridge之前,她在全球性领先机构担任重要职位,专门从事Java、分布式架构、大数据技术、高级分析、机器学习、语义技术和数据集成工具等领域的研发工作。Sunila是Broadridge在全球技术领导和创新论坛的理事,近在IEEE的工作是研究语义技术及其在业务数据湖中的作用。全球科技领域瞬息万变,新的技术层出不穷,Sunila的个人优势在于其密切关注并持续跟进全球科技,统上领下,串联前后,实现业务交付的具体架构方案。她从计算机科学专业研究生毕业后的一本出版著作是关于大数据数据仓库解决方案Greenplum的,书名为《Getting Started with Greenplum for Big Data Analytics》(Packt出版社)。她有自己的孩子和家庭,此外她是一名享誉国内外的印度古典舞蹈家,还是一位画家。 致谢首先,我要向Broadridge金融解决方案(印度)有限公司致以诚挚的谢意,感谢他们为我提供了一个追求技术的平台。 衷心感谢我的导师和公司董事总经理Laxmikanth V对我一如继往的支持,并撰写了推荐序。感谢国际工程学院(INSOFE)总裁Dakshinamurthy Kolluru博士发现了我对机器学习的热情。此外,还要感谢我的企业架构导师、Canopus咨询公司创始人兼首席架构师Nagaraju Pappu先生。 在此要特别感谢Packt出版社给我这个著书立作的机会,以及在本书的出版发行中提供的全程支持。这是我们合作出版的第二本书,能与极富专业精神的出版界人士和评审专家合作让我倍感荣幸。 感谢我的丈夫、家人和朋友一如既往的支持。我愧对的是可爱懂事的女儿Sai Nikita,在本书的编写过程中她和我一样心怀喜悦,但愿每天能有超过24小时陪她一起度过! 后,拙作献给技术领域所有不安分守己的大脑,是他们不懈追求,创新进取,才让人们的生活更加美好,更加精彩纷呈。
目 录
推荐序一 推荐序二 译者序 前言 关于作者 关于审校者 第1章 机器学习简介 1.1 机器学习 1.1.1 定义 1.1.2 核心概念与术语 1.1.3 什么是学习 1.1.4 机器学习中的数据不一致性 1.1.5 机器学习实践范例 1.1.6 机器学习问题类型 1.2 性能度量 1.3 机器学习的相关领域 1.3.1 数据挖掘 1.3.2 人工智能 1.3.3 统计学习 1.3.4 数据科学 1.4 机器学习处理流程及解决方案架构 1.5 机器学习算法 1.5.1 基于决策树的算法 1.5.2 基于贝叶斯的算法 1.5.3 基于核方法的算法 1.5.4 聚类算法 1.5.5 人工神经网络 1.5.6 降维方法 1.5.7 集成方法 1.5.8 基于实例的算法 1.5.9 基于回归分析的算法 1.5.10 基于关联规则的算法 1.6 机器学习工具与框架 1.7 小结 第2章 机器学习和大规模数据集 2.1 大数据和大规模机器学习 2.1.1 功能与架构:方法论的失配 2.1.2 机器学习的可扩展性和性能 2.1.3 模型选择过程 2.1.4 大规模机器学习的潜在问题 2.2 算法和并发 2.3 垂直扩展的机器学习技术方案 2.3.1 MapReduce编程架构 2.3.2 利用消息传递接口进行高性能计算 2.3.3 LINQ框架 2.3.4 使用LINQ操作数据集 2.3.5 GPU …… 第3章 Hadoop架构和生态系统简介 第4章 机器学习工具、库及框架 第5章 基于决策树的学习 第6章 基于实例和核方法的学习 第7章 关联规则学习 第8章 聚类学习 第9章 贝叶斯学习 第10章 基于回归的学习 第11章 深度学习 第12章 强化学习 第13章 集成学习 第14章 下一代机器学习数据架构
媒体评论
null