【怪毛匠子整理】

 

一、使用SOFT文件

1. 确定GEO平台,比如GPL25318, 通过NCBI找到这个平台,也可以通过下面的链接,把GPL25318 替换成你想要的平台ID。

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL25318

2. 下载SOFT文件 

 

 

 

点开红框:

下载文件:

 

 

 

 解压文件:

 

 

 

R语言处理# 读入文件

df2=read.table("GPL25318_family.soft",sep = "\t")
# 使用merge合并


  

 

【怪毛匠子整理】

二、使用GEOquery包

library(GEOquery)
GPL=getGEO("GPL25318",destdir = ".")
g1=Table(GPL)

head(exprSet$ID)

[1] "200000_s_at" "200001_at"   "200002_at"   "200003_s_at" "200004_at"   "200005_at"

new_datasets=merge(exprSet,g1,by  = "ID" ,all.x = T)

colnames(new_datasets)
[1] "ID"                        "GSM******"                "GSM******" 
.....
[247] "GSM******"                "GSM******"                "GSM******" 
[250] "Ensembl Version"           "Ensembl Genome Version"    "Orientation" 
[253] "Probeset mapping position" "Ensembl Gene ID"           "Gene Symbol" 
[256] "Chromosomal location"      "Strand"                    "Gene Description" 
[259] "Entrez Gene"               "SPOT_ID"

  这样就搞定了!

【怪毛匠子整理】