科学家们往NCBI/EMBL/DDBJ等数据库提交的组学数据,也可以提交到国家微生物科学数据中心(NMDC)了!
感受数据提交服务亮点:
线上全流程数据汇交,为您带来便捷提交新体验
便捷数据提交专业团队审核快速数据发表
l支撑中国科学家发表文章时的数据存储、共享。
l支持微生物项目、样本、核酸序列、微生物基因组、宏基因组、微生物元基因组、转录组、蛋白质结构、期刊附件等多种类型数据提交。
l支持国家重点研发计划、科技资源调查专项、国际合作专项等项目数据汇交。
l数据当日提交三个工作日内完成审核并发放编号。
l为每条数据提供DOI编号。
(图例来源为国家微生物科学数据中心数据提交页面)
NMDC网站可提交的数据类型共八种。包括生物项目数据(BioProject),即生物学研究项目信息进行收集整理的数据库,可以根据所产生的数据类型来识别一个项目;生物样本数据(BioSample)为一个中心位置,可与项目库链接,也可独立,用于收集病毒、细菌、真菌等微生物的菌株及样本、微生物环境样本(元基因组)描述信息;核酸序列数据(NucleotideSeq)收集16SrRNA、rRNA-ITS等特征基因片段以及其他微生物相关的核酸序列;原始组学数据(MSRA)收集管理测序产生的原始数据集;晶体结构数据(Structure)收集生物大分子(蛋白质、核酸等)的结构数据;期刊附件数据(Attchment)为生物学期刊提供文章的在线提交附件数据;基因组数据(Genome)收集拼接组装完整的基因组数据信息;宏基因数据(Metagenome)收集微生物宏基因组相关数据信息。各类数据之间采用线性、一对多、多对一的模式进行关联,从而形成“金字塔”式的信息组织与管理模式。
如何提交数据到NMDC?
01
注册用户
在NMDC网站第一次进行数据提交时需要先注册个人账户,按网站要求及个人真实情况填写即可,注册成功之后即可开始提交数据。
创建数据
02
创建生物项目
创建所有数据的第一步就是建立一个项目,项目是一个研究的总集合,其中可包含多个样本及数据,大多情况下创建数据的顺序为先建立一个项目,之后建立一个样本与此项目连接,之后建立的原始数据、基因组数据等再分别与项目和样本连接,这样,一个完整的与实验相关的数据汇交就完成了。
本次教程为创建生物样本,创建项目教程请参考前期推送
创建样本共有五个步骤。第一个步骤为填写提交人,联系人信息等,如果此数据由多方人员提供,可添加多个提交人和机构。其中姓名、邮箱及联系电话要准确填写,这些使我们可以用来及时联系用户。
第二步为填写样本基本信息,发布日期可选:审核后立即发布、期刊发布同步、指定日期发布可选择指定日期。样本项目标题填写,尽可能完整的写出物种名物种编号等,描述信息要写此样本主要用于做什么,包括什么类型的数据等。然后要选择数据访问协议类型,其中完全公开数据使用表示任何用户都可以访问、复制、收集和下载,而协议公开使用则表示用户使用此类数据时需征得数据提供者同意,点击选择后就要遵从此协议。
第三步为选择样本类型,根据自己的数据类型在基因组、宏基因组或标记序列(符合MIxS规定)、宏基因组或环境样本、微生物、对公共卫生造成影响的病原体、病毒样本中进行选择,不同类型的样本数据对应不同的属性信息。
第四步为填写样本属性,样本名称准确填写物种学名,下面的每一个属性信息以及他们的填写规范都在每一项后面有详细说明,按照规范填写即可,也可添加自己想要记录但系统没有列举的属性。
(图例来源为样本提交中填写样本属性的部分截图)
第五步为链接生物项目,如果有项目输入项目编号即可,如果没有可以跳过,之后再建立项目时连接样本也可,最好是先建立项目后建立样本。
全部填写完成后可以对自己填写的数据进行整体预览,如果检查无误即可点击提交,系统核验后会给用户发送正式编号,此编号用于后期提交的数据与此样本进行连接。这样一个生物样本就创建成功了。
创建原始组学数据
创建原始组学数据,原始组学是测序的最原始数据,共有四个步骤,第一个步骤为填写提交人,联系人信息等,与生物样本相同。
第二步为填写基本信息,发布日期可选:审核后立即发布、期刊发布同步、指定日期发布可选择指定日期。提交标题填写,尽可能完整的写出物种名物种编号等,已有项目指链接项目,输入项目正式编号即可,是否已有生物样本,如果有填写是,如果没有最好去建立一个生物样本。然后要选择数据访问协议类型,其中完全公开数据使用表示任何用户都可以访问、复制、收集和下载,而协议公开示用则表示用户使用此类数据时需征得数据提供者同意,点击选择后就要遵从此协议。
第三步为填写元数据,也就是此数据的基础信息,包括标题、样本编号、文库ID、文库策略、文库材料来源、文库选择、建库类型、测序平台、测序仪器等,这些根据自己数据基础信息进行填写,描述信息为对此数据的简短有力的描写,可包括测此数据的材料方法等。
第四步为传输文件,一般原始组学数据都较大,大于30M推荐使用FTP,小于30M推荐使用HTTP。
最后为预览界面,在此界面用户可以看到自己之前每一步提交所填写的信息,如果发现有哪一步填写错误,就可以点击上一步到那一步骤进行修改,如果检查无误即可点击提交,系统核验后会发送正式编号。
创建基因组数据
创建基因组数据,基因组数据是指拼接完整的测序数据,它的提交共有五个步骤,第一个步骤为填写提交人,联系人信息等,与生物样本相同。
第二步为填写基本信息,发布日期可选:审核后立即发布、期刊发布同步、指定日期发布可选择指定日期。标题填写,尽可能完整的写出物种名物种编号等,之后是链接生物项目与生物样本,输入他们的正式编号即可,接下来需确认此次提交是否是已提交基因组数据的更新,如果是需要输入那个基因组的正式编号,再确认数据的拼接方式是否denovo,之后填写拼接方法与此方法所用程序版本号。最后选择基因组数据类型,有全基因组、部分基因组、其他三种类型可选择。
第三步为上传文件,可根据自己genome文件的大小选择上传方式,大于30M推荐使用FTP,小于30M推荐使用HTTP。
第四步确认序列是否属于同一条染色体、同一个质粒。
第五步为填写序列作者,名字、姓氏必填,可添加多个。是否关联文章,若不关联则选否,若关联则需要填写所关联文章的文章状态、期刊名称、文章标题等,关联文章也可添加多个。之后要选择数据访问协议类型,其中完全公开数据使用表示任何用户都可以访问、复制、收集和下载,而协议公开示用则表示用户使用此类数据时需征得数据提供者同意,点击选择后就要遵从此协议。
最后为预览界面,在此界面用户可以看到自己之前每一步提交所填写的信息,如果发现有哪一步填写错误,可以点击上一步到那一步骤进行修改。如果检查无误即可点击提交,系统核验后会发送正式编号。
关于国家微生物科学数据中心的更多介绍:
国家微生物科学数据中心(NationalMicrobiologyDataCenter,NMDC)于年6月经科技部、财政部通知公布,由中科院微生物研究所作为依托单位建设。中心按照年国家发布的《科学数据管理办法》,承担微生物领域科学数据汇交管理、共享与服务工作。中心建立了微生物领域完善的数据体系,数据内容覆盖微生物资源、研究过程及工程、微生物组学、微生物技术、合成生物学等交叉学科以及微生物文献、专利、专家、成果等知识库,重点推进微生物领域科技资源向国家平台汇聚与整合,为科学研究、技术进步和社会发展提供高质量的科学数据资源共享服务。
中心官方网站链接: