犬种表型的多样性以及犬和人类相关的遗传疾病风险,使犬类成为研究复杂性状遗传基础和人类生物医学模型的理想对象。Dog10K 是一个正在进行的国际合作项目,旨在揭示犬类的表型多样性、疾病、行为和驯化历史的遗传基础。为了更好地展示和利用这些庞大的数据,王国栋学科组和生物多样性大数据中心合作建立了 Dog10K(https://dog10k.kiz.ac.cn/)数据库,一个综合性的犬类多组学数据库。
该数据库整合了来自 1987 只犬类基因组的单核苷酸变异(SNVs)、来自 43 个犬种的新发突变(DNMs)、以及来自海马的 105,057 个单核转录组(snRNA-seq)数据、来自白细胞的 74,067 个单细胞转录组(scRNA-seq)数据,还有从已发表犬科研究中获取的 30 个不同年龄的血液转录组(Aging transcriptome)样本。该数据库为所有数据提供了清晰的可视化、统计分析、浏览、搜索和下载功能。此外,还整合了 Selscan、LiftOver 和 AgeConversion 三种分析工具,以帮助研究人员定制化地探索这些全面的组学数据。Dog10K 数据库将为分析、展示和利用犬类多组学数据提供一个基础性平台, 有助于推动复杂性状及遗传疾病相关的研究,促进学术合作与研究成果的共享(图一)。
2024年10月21日,该研究成果以“Dog10K: An integrated Dog10K database summarizing canine multi-omics”为题发表在国际知名期刊Nucleic Acids Research的数据库专刊上。王国栋学科组助理工程师周通和生物多样性大数据中心工程师浦绍艳为论文共同第一作者,王国栋研究员与王亚楠高级工程师为论文共同通讯作者,王国栋学科组与生物多样性大数据中心的多位成员参与了本项工作,Elaine Ostrander教授对文章撰写做出重要指导和帮助。该工作得到了科技创新2030-“脑科学与类脑研究”重大项目、国家自然科学基金、春城计划等项目的资助。
文章链接:https://doi.org/10.1093/nar/gkae928
图一 数据库概览