眾所周知,人類基因組計劃宣告完成後產生了一個基於有限個體的人類參考基因組序列,這也是之後眾多分子生物學實驗研究的參照基礎。但隨著對人類基因組測序研究的廣泛開展、測序個體數量的不斷增加,科學家們發現,現有的人類基因組參考序列尚不夠完整,特別是在一些特定的人群或個體基因組中被測序到現有人類基因組參考序列中缺失的片段,也就是說,人類基因組的序列其實比已知的基因組參考序列要複雜,尚有很多未知序列(或者說暗物質)有待於科學家們通過不斷的深化研究加以發現。
泛基因組(Pan-genome)是指某個群體中所有個體基因組的總和。隨著測序技術的進展,針對人類某個群體的多個個體基因組的測序數據不斷積累增加,給泛基因組研究提供了前所未有的契機。然而,人類全基因組測序數據量龐大,現有針對如此大型基因組數據進行拚接研究的方法學有限,如果研究方法不加以創新,在分析過程中容易引入較多的拚接錯誤,且分析速度緩慢。為此,該聯合研究團隊進行了分析方法的創新,他們首先對原有真核生物泛基因組分析流程進行了改進,包括引入節約內存的拚接方法,可直接對每個個體的所有測序數據進行拚接以降低拚接錯誤,優化了泛基因組分析步驟,明顯提高了海量測序數據的分析速度和準確率。
新型分析方法對185個中國漢族人的全基因組深度測序分析,同時對開放數據庫內90個中國漢族人全基因組深度測序數據測試顯示,在中國漢族人全基因組測序數據中至少存在29.5Mb不同於人類參考基因組的新序列,暨人類基因組參考序列中漏掉的序列。通過新基因預測分析,發現188個新基因,且新序列中約40%僅見於中國漢族人群。
該新型方法的創立不僅僅為深入研究人類進化、人類遷徙規律、種族基因組差異以及新基因與人類疾病相關性提供了重要工具,還為其它具有較大基因組的高等動物泛基因組研究提供了重要分析工具。
該項研究是在上海交通大學醫工交叉重點項目、國家科技部及衛健委重點研發計劃、國家自然科學基金委以及上海市科委重點項目支持下完成。項目實施過程中還得到上海市轉化醫學協同創新中心和上海交通大學高性能計算中心的大力支持。
韋朝春,上海交通大學生命科學技術學院生物信息學與生物統計學係教授/博士生導師。先後於北京大學和美國華盛頓大學(聖路易斯)獲得數學學士、信息處理碩士和計算機科學博士學位。主要研究方向為基因組學和進化基因組學。具體研究內容包括基因組中的功能因子的識別及其進化分析、真核生物泛基因組學、腫瘤基因組學和宏基因組學等。
於穎彥,上海交通大學醫學院附屬瑞金醫院教授/博士生導師,上海消化外科研究所副所長,中國抗癌協會胃癌專業委員會委員,中國醫藥生物技術協會生物樣本庫分會及慢病管理分會常委。上海市浦江人才與上海市優秀學術帶頭人。從事消化病理、腫瘤分子分型、生物標誌物和轉化醫學研究。承擔國家重點研發計劃精準醫學專項和慢病專項,國家自然科學基金、上海市科委重點項目及上海交大醫工交叉重點項目等。
論文鏈接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1751-y
① 凡本站注明“稿件來源:beplay2網頁登錄”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式複製發表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:beplay2網頁登錄”,違者本站將依法追究責任。
② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出於非商業性的教育和科研之目的,並不意味著讚同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯係。