来自好基友 Chaoli 的供稿支持!!!!


NCBI上传数据,获取数据编号步骤详解

注意

开启代理服务器(vpn)可能会导致无法访问NCBI,如果打开NCBI失败,请尝试关闭代理服务器之后再访问NCBI。

准备工作

点击进入 SRA数据提交入口。

这里如果没有登录NCBI,需要先登录NCBI账户

点击log in按钮,直接登录已有NCBI账户或注册NCBI账户后完成登录。登录NCBI

安装Aspera浏览器插件

登录后返回SRA数据上传入口,第一次传输建议先下载安装 Aspera 浏览器插件,传输速度比普通网页传输要快很多倍。

点击箭头所指的Aspera Browser plugin完成下载及安装。Aspera安装

上传数据

再次回到SRA数据上传入口开始上传数据。点击New submission按钮。New submission
随后跳转到新的提交页面,共分为五个环节:1 SUBMITTER, 2 GENERAL INFO, 3 SRA METADATA, 4 FILES, 5 REVIEW & SUBMIT

中间的每一个环节都可以暂停并保存进度。五个环节

提交者信息

*的选项为必填项,其他选项可以不填。

Group for this submission选择 1 member或者根据实际情况添加成员,后续也可以编辑。

必要的个人信息、单位信息填写完毕后,点击Continue进入下一步。信息填写

SRA基础信息

如果是将SRA数据上传到某个已有的BioProject下的BioSample中,在BioProjectBioSample选项中选择Yes并在下面的输入框中输入已有的BioProject及BioSample编号即可。

如果SRA数据还没有创建对应的BioProject和BioSample,则选择No

最后选择SRA数据的释放时间,点击Continue按钮。SRA基础信息

SRA项目信息

上一步中的BioProjectBioSample如果都选择了No,接下来会增加3个环节,分别是3 PROJECT INFO, 4 BIOSAMPLE TYPE, 5 BIOSAMPLE ATTRIBUTES
SRA项目信息
同样不带*的选项,不用填写。

注意Project title尽量表达清晰。可以选择物种名 + 测序类型的形式。

其他必要的信息可以在Public description中补充。

点击Continue继续下一步。SRA项目信息

SRA样品类型

直接在All packages选项卡中选择Microbe即可。

点击Continue继续下一步。SRA样品类型

SRA样品属性

选择Use built-in table editor之后,在网页中直接填写。

同样带*的选项为必填项,带两个*的所有选项中至少要选填一项,带两个的选项同理。

一般可选择填写 样品名种名株系采集生境采集时间地理位置样品类型

点击Continue继续下一步。SRA样品属性

SRA数据信息

同样选择Use built-in table editor之后,在网页中直接填写。

需要注意的是,一般我们的数据是二代双端测序数据,每个文库产生对应的两个数据文件,比如DNA_1.fqDNA_2.fq

在填写数据信息的过程中是按照文库填写的,每个文库登记一行

Sample name单元格下拉选择数据所属的BioSample后,填写文库编号及文库标题。

如果是DNA测序数据Library strategy一般选择WGS,其他选项可以参照下图填写。

如果是RNAseq测序数据,则Library strategy要选择对应的RNA-SeqLibrary source根据提取实验方法可以选择TRANCRIPTOMICLibrary selection选择Oligo-dT

Design description可以补充提取实验的试剂盒信息。

所有文库信息填写完毕后,点击Continue继续下一步。SRA数据信息

上传文件完成提交

选择Web brower upload via HTTP or Aspera Connect plugin

点击Choose files按钮选择需要上传的文件,这里会自动调用刚才安装的Aspera插件进行传输,速度非常快,也没有10 GB的限制。

选择Autofinish submission按钮,数据传输完成自动提交,同时会发送邮件进行通知。上传文件完成提交
到这里SRA数据的提交就完成了。

获得SRA数据编号

SRA数据提交之后,NCBI会对数据进行审核,这个过程大概需要几天的时间。

数据审核通过后,SRA数据编号会直接发送到用户在NCBI登记的邮箱中。


NCBI上传SRA数据过程中,有时候还会出现许多奇奇怪怪的报错

  • 上传文件要是为.gz结尾的压缩文件,需要检查是否是真正的压缩格式,还是只是单纯改了文件后缀为.gz。若只改后缀名,上传文件后,系统会检查文件格式并返回错误信息。压缩文件错误
  • 单个文件大小要小于100Gb。上传文件大小
  • 不稳定的网络可能也会造成上传文件错误。