R-数据导入

时间:2024-03-27 10:05:08

目录


键盘输入

  • > mydata <- data.frame(age=numeric(0), gender=character(0), weight=numeric(0))
    > mydata <- edit(mydata)

    R-数据导入

  • 关闭“数据编辑器”数据就自动存入mydata中,重新编辑的话,数据仍在
  • > mydata
      age gender weight
    1  19      m     60
    2  15      f     51
    3  22      m     58

导入文本文件

  • read.table() 从带分隔符的文本文件中导入数据
  • mydataframe <- read.table(file,  header=TRUE/FALSE,  sep="delimiter",  row.names="name")
    • file              默认值sep=" ",是一个带分隔符的ASCII文本文件
    • header        是一个表明首行是否包含了变量名的逻辑值( TRUE 或 FALSE )
    • sep             用来指定分隔数据的分隔符
    • row.names   是一个可选参数,用以指定一个或多个表示行标识符的变量
    • 默认情况下,字符型变量将转换为因子,其禁止方式:
      • 设置选项 stringsAsFactors=FALSE
      • colClasses 为每一列指定一个类,例如 logical(逻辑型)、numeric(数值型)
  • # 从当前工作目录中读入了一个名为 studentgrades.csv 的逗号分隔文件
    # 从文件的第一行取得了各变量名称
    # 将变量 STUDENTID 指定为行标识符
    # 最后将结果保存到了名为 grades 的数据框中
    grades <- read.table("studentgrades.csv",  header=TRUE,  sep=",",  row.names="STUDENTID")

导入Excel文件

  • 使用xlsx包
    library(xlsx)
    workbook <- "c"/myworkbook.xlsx"
    mydataframe <- read.xlsx(workbook, 1)
  • 使用RODBC包
    library("RODBC")
    channel <- odbcConnectExcel("myfile.xls")
    mydataframe <- sqlFetch(channel, "mysheet")
    odbcClose(channel)