第 1章 R语言基础知识 1
1.1 对象与赋值 1
1.2 数据结构 1
1.2.1 原子向量 2
1.2.2 列表 9
1.2.3 因子 12
1.2.4 矩阵 15
1.2.5 数据框 17
1.3 常用函数 23
1.4 控制语句 27
1.4.1 分支语句 27
1.4.2 循环语句 28
1.5 管道操作符 31
1.6 自定义函数 33
1.7 其他 36
1.7.1 工作目录与RStudio项目 36
1.7.2 编程风格 38
1.7.3 帮助 40
1.7.4 R、 RStudio及R包的版本更新 42
1.8 更多学习资源 42
练习题参考答案 42
第 2章 数据导入 44
2.1 将外部数据文件导入R 44
2.1.1 菜单式导入 44
2.1.2 命令式导入 47
2.1.3 解析函数 49
2.2 将处理后的数据导出到外部数据文件 52
2.3 有关中文乱码问题 52
2.4 更多学习资源 55
第3章 数据整理 56
3.1 整洁数据 56
3.1.1 数据的形式结构 56
3.1.2 数据的语义结构 57
3.1.3 整洁数据简介 57
3.1.4 非整洁数据的常见形式 59
3.2 长宽变换 62
3.2.1 宽变长 62
3.2.2 长变宽 67
3.3 拆分与合并列 71
3.3.1 拆分列 71
3.3.2 合并列 72
3.4 处理缺失值 73
3.4.1 将隐式缺失值变为显式缺失值 73
3.4.2 去掉带有缺失值的行 75
3.4.3 用相邻值填充缺失值 75
3.4.4 用已知值替换缺失值 76
3.5 更多学习资源 77
练习题参考答案 77
第4章 数据变换 78
4.1 单表操作 78
4.1.1 行操作 78
4.1.2 列操作 82
4.1.3 分组操作 89
4.1.4 辅助操作 94
4.1.5 转换变量类型 100
4.1.6 其他操作 104
4.2 双表操作 106
4.2.1 合并连接 106
4.2.2 筛选连接 108
4.2.3 集合操作 111
4.2.4 组合操作 112
4.3 更多学习资源 114
练习题参考答案 114
第5章 处理日期、因子与字符串 115
5.1 处理日期 115
5.1.1 创建日期型变量 115
5.1.2 获取日期成分 118
5.1.3 修改日期成分 121
5.1.4 日期的四舍五入 121
5.1.5 日期的数学运算 122
5.1.6 时区 125
5.1.7 其他 126
5.2 处理因子 127
5.2.1 因子水平计数 128
5.2.2 增加与删除因子水平 129
5.2.3 修改与合并因子水平 130
5.2.4 改变因子水平的顺序 132
5.3 处理字符串 134
5.3.1 正则表达式 134
5.3.2 字符串处理函数 141
5.4 更多学习资源 147
练习题参考答案 147
第6章 数据可视化 152
6.1 ggplot2简介 152
6.2 几何对象 153
6.2.1 美学属性映射 153
6.2.2 统计变换 160
6.2.3 位置调整 162
6.2.4 常用几何对象函数 165
6.3 标度 178
6.3.1 标度函数的5个重要参数 178
6.3.2 3类重要的标度函数 184
6.3.3 关于图例 190
6.4 坐标 195
6.4.1 笛卡儿坐标 195
6.4.2 坐标翻转 198
6.4.3 极坐标 199
6.5 分面 200
6.6 主题 202
6.6.1 主题函数 202
6.6.2 主题元素 203
6.6.3 元素函数 204
6.6.4 主题套装 204
6.6.5 多张图形应用相同主题 205
6.7 保存图像 208
6.8 其他 209
6.8.1 在图形中插入数学公式 209
6.8.2 在图形中使用其他字体 212
6.8.3 多图组合排版 215
6.9 更多学习资源 222
练习题参考答案 223
第7章 编程 226
7.1 map()函数族 226
7.1.1 map() 226
7.1.2 参数.f的5种形式 229
7.1.3 map()的扩展函数 230
7.2 更多学习资源 239
练习题参考答案 240
第8章 建模 241
8.1 将模型输出整洁化 241
8.2 列表列 243
8.2.1 列表列与嵌套数据框 243
8.2.2 列表列工作流 244
8.3 更多学习资源 246
练习题参考答案 246
第9章 沟通 247
9.1 R Markdown简介 247
9.2 R Markdown文档 247
9.2.1 Markdown文本 250
9.2.2 代码段 251
9.2.3 YAML文件头 253
9.3 将R Markdown编译成中文PDF文档 254
9.3.1 编译为PDF文档 255
9.3.2 PDF文档的中文显示 256
9.4 更多学习资源 256
第 10章 数据科学实践 257
10.1 格点搜索算法 257
10.2 Monte Carlo模拟 258
10.3 Bootstrap 267
10.4 更多学习资源 268
练习题参考答案 269
参考文献 271