NCBI上传数据“指北”
来自好基友 Chaoli 的供稿支持!!!!
NCBI上传数据,获取数据编号步骤详解
注意
开启代理服务器(vpn)可能会导致无法访问NCBI,如果打开NCBI失败,请尝试关闭代理服务器之后再访问NCBI。
准备工作
点击进入 SRA数据提交入口。
这里如果没有登录NCBI,需要先登录NCBI账户
点击log in
按钮,直接登录已有NCBI账户或注册NCBI账户后完成登录。
安装Aspera
浏览器插件
登录后返回SRA数据上传入口,第一次传输建议先下载安装 Aspera 浏览器插件,传输速度比普通网页传输要快很多倍。
点击箭头所指的Aspera Browser plugin
完成下载及安装。
上传数据
再次回到SRA数据上传入口开始上传数据。点击New submission
按钮。
随后跳转到新的提交页面,共分为五个环节:1 SUBMITTER
, 2 GENERAL INFO
, 3 SRA METADATA
, 4 FILES
, 5 REVIEW & SUBMIT
。
中间的每一个环节都可以暂停并保存进度。
提交者信息
带*
的选项为必填项,其他选项可以不填。
Group for this submission
选择 1 member
或者根据实际情况添加成员,后续也可以编辑。
必要的个人信息、单位信息填写完毕后,点击Continue
进入下一步。
SRA基础信息
如果是将SRA数据上传到某个已有的BioProject下的BioSample中,在BioProject
和BioSample
选项中选择Yes
并在下面的输入框中输入已有的BioProject及BioSample编号即可。
如果SRA数据还没有创建对应的BioProject和BioSample,则选择No
。
最后选择SRA数据的释放时间,点击Continue
按钮。
SRA项目信息
上一步中的BioProject
和BioSample
如果都选择了No
,接下来会增加3个环节,分别是3 PROJECT INFO
, 4 BIOSAMPLE TYPE
, 5 BIOSAMPLE ATTRIBUTES
。
同样不带*
的选项,不用填写。
注意Project title
尽量表达清晰。可以选择物种名 + 测序类型
的形式。
其他必要的信息可以在Public description
中补充。
点击Continue
继续下一步。
SRA样品类型
直接在All packages
选项卡中选择Microbe
即可。
点击Continue
继续下一步。
SRA样品属性
选择Use built-in table editor
之后,在网页中直接填写。
同样带*
的选项为必填项,带两个*
的所有选项中至少要选填一项,带两个†
的选项同理。
一般可选择填写 样品名
、种名
、株系
、采集生境
、采集时间
、地理位置
和样品类型
。
点击Continue
继续下一步。
SRA数据信息
同样选择Use built-in table editor
之后,在网页中直接填写。
需要注意的是,一般我们的数据是二代双端测序数据,每个文库产生对应的两个数据文件,比如DNA_1.fq
和DNA_2.fq
。
在填写数据信息的过程中是按照文库填写的,每个文库登记一行。
在Sample name
单元格下拉选择数据所属的BioSample
后,填写文库编号及文库标题。
如果是DNA测序数据Library strategy
一般选择WGS
,其他选项可以参照下图填写。
如果是RNAseq测序数据,则Library strategy
要选择对应的RNA-Seq
,Library source
根据提取实验方法可以选择TRANCRIPTOMIC
,Library selection
选择Oligo-dT
。
Design description
可以补充提取实验的试剂盒信息。
所有文库信息填写完毕后,点击Continue
继续下一步。
上传文件完成提交
选择Web brower upload via HTTP or Aspera Connect plugin
。
点击Choose files
按钮选择需要上传的文件,这里会自动调用刚才安装的Aspera
插件进行传输,速度非常快,也没有10 GB的限制。
选择Autofinish submission
按钮,数据传输完成自动提交,同时会发送邮件进行通知。
到这里SRA数据的提交就完成了。
获得SRA数据编号
SRA数据提交之后,NCBI会对数据进行审核,这个过程大概需要几天的时间。
数据审核通过后,SRA数据编号会直接发送到用户在NCBI登记的邮箱中。
NCBI上传SRA数据过程中,有时候还会出现许多奇奇怪怪的报错。
- 上传文件要是为.gz结尾的压缩文件,需要检查是否是真正的压缩格式,还是只是单纯改了文件后缀为.gz。若只改后缀名,上传文件后,系统会检查文件格式并返回错误信息。
- 单个文件大小要小于100Gb。
- 不稳定的网络可能也会造成上传文件错误。