R 语言数据科学基础——基于tidyverse

978-7-115-60705-8
作者: 高华川
译者:
编辑: 张涛

图书目录:

第 1章 R语言基础知识 1

1.1 对象与赋值 1

1.2 数据结构 1

1.2.1 原子向量 2

1.2.2 列表 9

1.2.3 因子 12

1.2.4 矩阵 15

1.2.5 数据框 17

1.3 常用函数 23

1.4 控制语句 27

1.4.1 分支语句 27

1.4.2 循环语句 28

1.5 管道操作符 31

1.6 自定义函数 33

1.7 其他 36

1.7.1 工作目录与RStudio项目 36

1.7.2 编程风格 38

1.7.3 帮助 40

1.7.4 R、 RStudio及R包的版本更新 42

1.8 更多学习资源 42

练习题参考答案 42

第 2章 数据导入 44

2.1 将外部数据文件导入R 44

2.1.1 菜单式导入 44

2.1.2 命令式导入 47

2.1.3 解析函数 49

2.2 将处理后的数据导出到外部数据文件 52

2.3 有关中文乱码问题 52

2.4 更多学习资源 55

第3章 数据整理 56

3.1 整洁数据 56

3.1.1 数据的形式结构 56

3.1.2 数据的语义结构 57

3.1.3 整洁数据简介 57

3.1.4 非整洁数据的常见形式 59

3.2 长宽变换 62

3.2.1 宽变长 62

3.2.2 长变宽 67

3.3 拆分与合并列 71

3.3.1 拆分列 71

3.3.2 合并列 72

3.4 处理缺失值 73

3.4.1 将隐式缺失值变为显式缺失值 73

3.4.2 去掉带有缺失值的行 75

3.4.3 用相邻值填充缺失值 75

3.4.4 用已知值替换缺失值 76

3.5 更多学习资源 77

练习题参考答案 77

第4章 数据变换 78

4.1 单表操作 78

4.1.1 行操作 78

4.1.2 列操作 82

4.1.3 分组操作 89

4.1.4 辅助操作 94

4.1.5 转换变量类型 100

4.1.6 其他操作 104

4.2 双表操作 106

4.2.1 合并连接 106

4.2.2 筛选连接 108

4.2.3 集合操作 111

4.2.4 组合操作 112

4.3 更多学习资源 114

练习题参考答案 114

第5章 处理日期、因子与字符串 115

5.1 处理日期 115

5.1.1 创建日期型变量 115

5.1.2 获取日期成分 118

5.1.3 修改日期成分 121

5.1.4 日期的四舍五入 121

5.1.5 日期的数学运算 122

5.1.6 时区 125

5.1.7 其他 126

5.2 处理因子 127

5.2.1 因子水平计数 128

5.2.2 增加与删除因子水平 129

5.2.3 修改与合并因子水平 130

5.2.4 改变因子水平的顺序 132

5.3 处理字符串 134

5.3.1 正则表达式 134

5.3.2 字符串处理函数 141

5.4 更多学习资源 147

练习题参考答案 147

第6章 数据可视化 152

6.1 ggplot2简介 152

6.2 几何对象 153

6.2.1 美学属性映射 153

6.2.2 统计变换 160

6.2.3 位置调整 162

6.2.4 常用几何对象函数 165

6.3 标度 178

6.3.1 标度函数的5个重要参数 178

6.3.2 3类重要的标度函数 184

6.3.3 关于图例 190

6.4 坐标 195

6.4.1 笛卡儿坐标 195

6.4.2 坐标翻转 198

6.4.3 极坐标 199

6.5 分面 200

6.6 主题 202

6.6.1 主题函数 202

6.6.2 主题元素 203

6.6.3 元素函数 204

6.6.4 主题套装 204

6.6.5 多张图形应用相同主题 205

6.7 保存图像 208

6.8 其他 209

6.8.1 在图形中插入数学公式 209

6.8.2 在图形中使用其他字体 212

6.8.3 多图组合排版 215

6.9 更多学习资源 222

练习题参考答案 223

第7章 编程 226

7.1 map()函数族 226

7.1.1 map() 226

7.1.2 参数.f的5种形式 229

7.1.3 map()的扩展函数 230

7.2 更多学习资源 239

练习题参考答案 240

第8章 建模 241

8.1 将模型输出整洁化 241

8.2 列表列 243

8.2.1 列表列与嵌套数据框 243

8.2.2 列表列工作流 244

8.3 更多学习资源 246

练习题参考答案 246

第9章 沟通 247

9.1 R Markdown简介 247

9.2 R Markdown文档 247

9.2.1 Markdown文本 250

9.2.2 代码段 251

9.2.3 YAML文件头 253

9.3 将R Markdown编译成中文PDF文档 254

9.3.1 编译为PDF文档 255

9.3.2 PDF文档的中文显示 256

9.4 更多学习资源 256

第 10章 数据科学实践 257

10.1 格点搜索算法 257

10.2 Monte Carlo模拟 258

10.3 Bootstrap 267

10.4 更多学习资源 268

练习题参考答案 269

参考文献 271

详情

内 容 提 要 R语言中的tidyverse包可以使数据的处理、转换和可视化变得简单、合理且可复制,大大简化了数据整理的过程。本书详细介绍了tidyverse包,主要内容包括R语言基础知识,数据导入,数据整理,数据变换,处理日期、因子与字符串,数据可视化,编程,建模等内容。 本书图文结合,实例丰富,语言通俗易懂,既适合商业数据分析从业者阅读,也适合科研工作者、统计工作者(特别是医学统计从业者)及各大专院校相关专业的师生等学习。

图书摘要

相关图书

Python编程快速上手——让烦琐工作自动化(第3版)
Python编程快速上手——让烦琐工作自动化(第3版)
DeepSeek原理与项目实战大模型部署、微调与应用开发
DeepSeek原理与项目实战大模型部署、微调与应用开发
精通MCP:AI智能体开发实战
精通MCP:AI智能体开发实战
C++程序设计语言(第4版)(上、下册)
C++程序设计语言(第4版)(上、下册)
驾驭 Gemini 3与Nano Banana:人人都是AI产品创客
驾驭 Gemini 3与Nano Banana:人人都是AI产品创客
人人都是AI程序员:TRAE+Cursor 从0到1全栈实战
人人都是AI程序员:TRAE+Cursor 从0到1全栈实战

相关文章

相关课程