中國科學技術大學實現多種空間轉錄組分析算法的係統性評估
近日,中國科學技術大學生命科學與醫學部瞿昆教授課題組通過設計一整套分析流程,係統性評估了16種空間轉錄組和單細胞轉錄組數據整合算法在預測基因或細胞類型空間分布方麵的性能。研究成果以“Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution”為題,於2022年5月16日在線發表於國際知名學術期刊Nature Methods。
細胞在組織器官內所處的空間位置對於它發揮特異性功能至關重要。近年來,研究者開發了多種空間轉錄組技術可以在保留細胞精確空間定位的同時,檢測細胞內全轉錄組的表達,以此來研究在發育或疾病發生發展過程中起關鍵性作用的細胞亞群及其分子機製。然而,現有的空間轉錄組學技術存在兩個不足:1.基於測序的空間轉錄組技術無法實現真正意義上的單細胞分辨率;2.基於成像空間轉錄組的技術能檢測到的基因通量有限。為了突破技術的局限性,生物信息學家設計了多種算法整合空間轉錄組與單細胞轉錄組數據,預測細胞類型的空間分布和/或單個細胞的完整轉錄組信息。這些算法大大加深了我們對空間轉錄組學數據及相關生物學和病理過程的理解。然而,由於不同算法的工作原理和適用範圍存在顯著差異,使得研究者很難選擇最佳算法用來預測細胞類型和基因表達的空間分布。
瞿昆教授課題組長期致力於開發生物大數據分析算法和軟件。在此項研究中,課題組收集了45對同一組織來源的空間轉錄組與單細胞轉錄組數據集,和32個模擬數據集,並設計了多種指標,從準確性、魯棒性、計算資源耗時等多維度係統性評估了16種整合算法的性能。
圖1.整合分析流程
結果顯示,Cell2location、SpatialDWLS和RCTD算法能更加準確的預測細胞類型的空間分布;Tangram、gimVI和SpaGE算法是預測基因表達空間分布的最佳算法。Tangram、Seurat和LIGER計算效率相對較高,適合處理大規模數據集。該研究工作總結了每種算法的屬性、性能和適用性,總結了高效算法的優勢,為研究人員進一步提升算法性能提供了參考;並在github上提供了整合空間轉錄組和單細胞轉錄組數據的分析流程,以幫助研究人員為處理自己的數據選擇最佳的分析工具。
中科大生命科學與醫學部瞿昆教授為本文的通訊作者,課題組特任副研究員黎斌(現北京生命科學研究所研究員)、博士生張文和特任副研究員郭闖為本文的共同第一作者。這項工作得到基金委傑出青年基金、國家重點研發計劃、基金委自然科學基金、中科院基礎研究青年團隊、安徽省科技重大專項等項目的經費支持。中科大薛天教授、陳發來教授和程臨釗教授課題組為該工作的順利開展提供了巨大支持。
(來源:中國科學技術大學)
免責聲明:
① 凡本站注明“稿件來源:beplay2網頁登錄”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式複製發表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:beplay2網頁登錄”,違者本站將依法追究責任。
② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出於非商業性的教育和科研之目的,並不意味著讚同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯係。