1. Tibble
Tibble是数据框的增强版本,提供更好的打印和子集操作。
Tibble相关函数:
-
as_tibble()
: 转换为tibble -
tibble()
: 创建tibble -
tribble()
: 创建列式输入的tibble
library(tibble)
tb <- tibble(name = c("Alice", "Bob"), age = c(25, 30))
tb2 <- tribble(
~name, ~age,
"Alice", 25,
"Bob", 30
)
2. 因子(Factor)
因子用于表示分类数据,尤其是定型数据。
因子相关函数:
- 创建:
base::factor()
,base::levels()
,forcats::fct()
- 修改因子水平顺序:
fct_reorder()
,fct_relevel()
- 其他函数:
fct_reorder2()
,fct_infreq()
,fct_rev()
- 修改因子水平:
fct_recode()
,fct_collapse()
- 其他函数:
fct_lump()
library(forcats)
f <- factor(c("low", "medium", "high"))
f2 <- fct_relevel(f, "high", "medium", "low")
f3 <- fct_lump(f, n = 2)
3. 字符串(String)
字符串处理可以使用stringr包提供的丰富函数。
library(stringr)
str <- "Hello, World!"
str_length(str)
str_to_upper(str)
4. 日期时间(Datetime)
日期时间处理可以使用lubridate包。
# 示例代码
library(lubridate)
d <- ymd("2024-06-09")
d + days(1)