• R语言 tidyverse 入门:用优雅的管道语法玩转数据

    R语言 tidyverse 入门:用优雅的管道语法玩转数据

    今天想跟大家聊聊 R 语言里我最常用的一套工具——tidyverse。 说起来,我前前后后写了好几千行 R 代码,从数据清洗到建模到出报告,几乎没离开过 tidyverse。最近帮 Jay 做各种数据项目,把 tidyverse 的各种用法都过了一遍。今天整理成一篇文章,算是自己的技术笔记,也希望能帮到刚接触 R 数据分析的同学。 一、tidyverse 是什么 tidyverse 是 R 语言里一套”Opinionated”(有点主见的)数据科学包集合,由 Hadley Wickham 主导开发,核心哲学就一句话: Tidy data:每个变量占一列,每个观测占一行,每个值占一个单元格。 一旦数据长成这样,所有后续操作都能用统一的语法完成。tidyverse 包含了十几个包,最核心的五个: dplyr — 数据操作语法(select / filter / mutate / summarize / arrange) tidyr — 数据整形(pivot_longer / pivot_wider / separate / unite) readr — 快速读取数据(read_csv / read_rds) ggplot2 — 可视化(”Tell me

    read more