精神分裂症是一种复杂且具有较高异质性的疾病,其遗传率高达0.8,终身患病率约为1%。精神分裂症的确切致病基因如何鉴定是目前遗传学研究的一个重要挑战。近些年来,随着基因分型技术的发展,多个与精神分裂症相关的遗传风险位点已经被鉴定。例如,基于全基因组关联研究(GWAS)的方法,研究者发现人类基因组上超过200个精神分裂症风险基因座;基于拷贝数变异(CNV)研究也鉴定到了基因组上多个区域的CNVs与精神分裂症相关;利用高通量测序技术对大规模的精神分裂症患者和正常对照的大脑组织进行基因表达和甲基化分析研究,也鉴定到了一些精神分裂症的风险基因。但是,如何系统地利用这些已发表的数据来进一步的探究精神分裂症的遗传机制,是该领域研究的热点和难点。
前期我们对精神分裂症的GWAS数据、CNV数据以及基因表达数据进行了深入地分析与挖掘,建立了精神分裂症风险基因打分表等,并构建了精神分裂症的遗传研究数据库SZDB(www.szdb.org/SZDB)(Schizophrenia Bulletin 2017)。但是,该数据库存在一些不足:(1)基因打分系统过于武断,将每条与精神分裂症相关的证据同等对待;(2)所有收集的基因表达数据都基于芯片数据,样本量较小,而最近的多项基于高通量测序的大规模基因表达研究没有被纳入考虑;(3)该数据库发表后,后期更大规模的精神分裂症GWAS研究鉴定到了更多与该疾病相关的位点。基于以上原因,SZDB第一版亟待更新。
近期,我们收集了精神分裂症相关的研究数据,并对SZDB进行了大规模更新,形成了升级版SZDB2.0(www.szdb.org)。本次更新的主要内容有:(1)增加了精神分裂症大规模的GWAS研究数据;(2)加入了精神分裂症的功能基因组注释信息;(3)使用大规模的高通量测序研究结果替换芯片基因表达研究结果;(4)增加了外显子测序数据;(5)重做基因打分系统;(6)收录更多的CNV结果;(7)融合了多基因风险评分工具;(8)其他的一些数据更新及界面更新。本次更新后,数据库中已加入更多的大规模测序数据,并囊括了近些年发表的关于精神分裂症遗传研究的主要数据。同时,得益于响应式页面的设计模式,该数据库可在移动端有友好的展示。
我们关于该数据库更新的详细内容,近期以“SZDB2.0: an updated comprehensive resource for schizophrenia research”为题,发表在人类遗传学领域期刊Human Genetics发表(https://link.springer.com/article/10.1007/s00439-020-02171-1)。姚永刚课题组的武勇博士为该论文的第一作者,罗雄剑研究员和姚永刚研究员为该论文的共同通讯作者。该工作得到中国科学院脑功能联结图谱先导专项、中国科学院前沿重点研究项目和国家自然科学基金委的资助。
图1. 精神分裂症遗传数据库SZDB 2.0. (A)数据库主要内容;(B)数据库界面。