编辑推荐
null
内容简介
经典统计理论和机器学习方法为数据挖掘提供了必要的分析技术。本书系统地介绍统计分析和机器学习领域中最为重要和流行的多种技术及其基本原理,在详解有关算法的基础上,结合大量R语言实例演示了这些理论在实践中的使用方法。具体内容被分成三个部分,即R语言编程基础、基于统计的数据分析方法以及机器学习理论。统计分析与机器学习部分又具体介绍了参数估计、假设检验、极大似然估计、非参数检验方法(包括列联分析、符号检验、符号秩检验等)、方差分析、线性回归(包括岭回归和Lasso方法)、逻辑回归、支持向量机、聚类分析(包括K均值算法和EM算法)和人工神经网络等内容。同时,统计理论的介绍也为深化读者对于后续机器学习部分的理解提供了很大助益。知识结构和阅读进度的安排上既兼顾了循序渐进的学习规律,亦统筹考虑了夯实基础的必要性。本书内容与实际应用结合紧密,又力求突出深入浅出、系统翔实之特色,对算法原理的解释更是细致入微。 左飞编著的《R语言实战(机器学习与数据分析)》非常适合大专院校相关专业师生自学研究之用,亦可作为数据分析和数据挖掘相关领域从业人员的参考指导用书。
目 录
第1章 初识R语言 1.1 R语言简介 1.2 安装与运行 1.3 开始使用R 1.4 包的使用 1.5 使用帮助 第2章 探索R数据 2.1 向量的创建 2.2 向量的运算 2.3 向量的筛选 2.4 矩阵的创建 2.5 矩阵的使用 2.5.1 矩阵的代数运算 2.5.2 修改矩阵的行列 2.5.3 对行列调用函数 2.6 矩阵的筛选 第3章 编写R程序 3.1 流程的控制 3.1.1 条件选择结构的概念 3.1.2 条件选择结构的语法 3.1.3 循环结构的基本概念 3.1.4 循环结构的基本语法 3.2 算术与逻辑 3.3 使用函数 3.3.1 函数式语言 3.3.2 默认参数值 3.3.3 自定义函数 3.3.4 递归的实现 3.4 编写代码 第4章 概率统计基础 4.1 概率论的基本概念 4.2 随机变量数字特征 4.2.1 期望 4.2.2 方差 4.3 基本概率分布模型 4.3.1 离散概率分布 4.3.2 连续概率分布 4.3.3 使用内嵌分布 4.4 大数定理及其意义 4.5 中央极限定理 4.6 随机采样分布 第5章 实用统计图形 5.1 饼状图 5.2 直方图 5.3 核密图 5.4 箱线图 5.4.1 箱线图与分位数 5.4.2 使用并列箱线图 5.5 条形图 5.5.1 基本条形图及调整 5.5.2 堆砌与分组条形图 5.6 分位数与QQ图 第6章 数据输入/输出 第7章 高级数据结构 第8章 统计推断 第9章 非参数检验方法 第10章 一元线性回归 第11章 线性回归进阶 第12章 方差分析方法 第13章 聚类分析 第14章 支持向量机 第15章 人工神经网络 参考文献
媒体评论
null