编辑推荐
null
内容简介
德米特里·齐诺维耶夫著的《Python数据科学入门》以Python语言讲解数据科学基础知识,涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python核心特性,文本数据、数据库、表格形式的数值数据、series和data-xss、网络数据的使用,数据的绘制,概率与统计,机器学习。 本书面向研究生和本科生、数据科学教员、刚入门的数据科学专业人员,以及那些想拥有一本参考手册来帮助记住所有Python函数及参数的开发人员。
作者介绍
德米特里·齐诺维耶夫(Dmitry Zinoviev)德米特里·齐诺维耶夫(Dmitry Zinoviev) 计算机科学教授,自2001年起一直在萨福克大学任教。研究兴趣包括计算机模拟与建模、网络科学、社交网络分析以及数字人文。拥有莫斯科国立大学物理学硕士学位和纽约州立大学石溪分校计算机科学博士学位。
目 录
第1章 什么是数据科学 第1单元 数据分析步骤 第2单元 数据获取途径 第3单元 报告的结构 轮到你了 第2章 数据科学的Python核心 第4单元 理解基本的字符串函数 第5单元 选择合适的数据结构 第6单元 通过列表推导式理解列表 第7单元 使用计数器 第8单元 使用文件 第9单元 上网 第10单元 使用正则表达式实现模式匹配 第11单元 globbing文件名与其他字符串 第12单元 Pickling和Unpickling数据 轮到你了 第3章 使用文本数据 第13单元 处理HTML文件 第14单元 处理CSV文件 第15单元 读取JSON文件 第16单元 处理自然语言中的文本 轮到你了 第4章 使用数据库 第17单元 设置MySQL数据库 第18单元 使用MySQL数据库:命令行 第19单元 使用MySQL数据库:pymysql 第20单元 改善文档存储:MongoDB 轮到你了 第5章 使用表格形式的数值数据 第21单元 创建数组 第22单元 转置和重排 第23单元 索引和切片 第24单元 广播 第25单元 揭秘通用函数 第26单元 理解条件函数 第27单元 数组的聚合与排序 第28单元 将数组用作集合 第29单元 数组的保存和读取 第30单元 生成合成正弦波 轮到你了 第6章 使用series和data-xss 第31单元 pandas数据结构 第32单元 数据重塑 第33单元 处理缺失数据 第34单元 组合数据 第35单元 数据的排序和描述 第36单元 数据转换 第37单元 掌握pandas的文件读写功能 轮到你了 第7章 使用网络数据 第38单元 概念剖析 第39单元 网络分析序列 第40单元 使用networkx 轮到你了 第8章 绘图 第41单元 使用PyPlot进行基本绘图 第42单元 了解其他绘图类型 第43单元 精通绘图装饰 第44单元 用pandas绘图 轮到你了 第9章 概率与统计 第45单元 回顾概率分布 第46单元 回顾统计度量 第47单元 以Python的方式完成统计 轮到你了 第10章 机器学习 第48单元 设计预测实验 第49单元 线性回归拟合 第50单元 用k均值聚类实现数据分组 第51单元 在随机决策森林中生存 轮到你了 附录1 扩展阅读 附录2 单星项目的解决方案 参考文献
媒体评论
null