R语言中的数据结构和相关函数总结-二、进阶数据结构

时间:2024-06-11 08:32:45

1. Tibble

Tibble是数据框的增强版本,提供更好的打印和子集操作。

Tibble相关函数:
  • as_tibble(): 转换为tibble
  • tibble(): 创建tibble
  • tribble(): 创建列式输入的tibble
library(tibble)
tb <- tibble(name = c("Alice", "Bob"), age = c(25, 30))
tb2 <- tribble(
  ~name, ~age,
  "Alice", 25,
  "Bob", 30
)

2. 因子(Factor)

因子用于表示分类数据,尤其是定型数据。

因子相关函数:
  • 创建:base::factor(), base::levels(), forcats::fct()
  • 修改因子水平顺序:fct_reorder(), fct_relevel()
  • 其他函数:fct_reorder2(), fct_infreq(), fct_rev()
  • 修改因子水平:fct_recode(), fct_collapse()
  • 其他函数:fct_lump()
library(forcats)
f <- factor(c("low", "medium", "high"))
f2 <- fct_relevel(f, "high", "medium", "low")
f3 <- fct_lump(f, n = 2)

3. 字符串(String)

字符串处理可以使用stringr包提供的丰富函数。

library(stringr)
str <- "Hello, World!"
str_length(str)
str_to_upper(str)

4. 日期时间(Datetime)

日期时间处理可以使用lubridate包。

# 示例代码
library(lubridate)
d <- ymd("2024-06-09")
d + days(1)