科研進展
西北高原所發(fā)表藏羚首個染色體水平的高質(zhì)量基因組
藏羚(Pantholops hodgsonii)是世居青藏高原的典型反芻動物,平均分布海拔3,250-5,500 m,屬鯨偶蹄目(Cetartiodactyla),??疲˙ovidae),藏羚屬(Pantholops),是藏羚屬唯一物種。19世紀中期至20世紀初,猖獗的非法盜獵使藏羚的種群數(shù)量下降了約90%,2000年被IUCN紅色瀕危物種名錄評估為瀕危物種。經(jīng)過30多年的保護,藏羚的種群數(shù)量恢復(fù)到了20多萬只,IUCN對其評級也從瀕危降為近危。藏羚不僅是世界上分布海拔最高的反芻動物之一,也是青藏高原唯一具有長距離遷徙行為的物種,是研究高海拔適應(yīng)性機制和遷徙行為的良好模型。然而迄今為止,公開數(shù)據(jù)庫中仍缺少藏羚高質(zhì)量的染色體水平基因組,嚴重限制了基于遺傳特征解析其物種適應(yīng)、進化及種群生態(tài)相關(guān)工作的開展。
中國科學(xué)院西北高原生物研究所動物生態(tài)與資源保護研究團隊聯(lián)合青海大學(xué),基于PacBio HiFi三代基因組測序、Hi-C測序和DNBSEQ-T7二代基因組survey測序三種測序技術(shù),成功組裝了藏羚染色體級別的基因組。結(jié)果顯示,藏羚基因組大小為3.1 Gb,Contig N50為84.6 Mb,所有基因掛載到30條染色體上(29?。),與之前的核型研究一致。數(shù)據(jù)評估顯示,藏羚基因組BUSCO得分為98.2%(S:92.3%,D:5.9%,F(xiàn):0.8%,M:1.0%),平均QV值為70.14,表明組裝的連續(xù)性好,完整度和準確性高。基于EDTA和RepeatModeler從頭預(yù)測的藏羚基因組中重復(fù)序列注釋結(jié)果表明,藏羚基因組重復(fù)序列主要由SINEs、LINEs、LTRs 和DNA transposons四種類型組成,序列總長度為1.65 Gb,占基因組的52.47%;基于蛋白同源預(yù)測、蛋白從頭預(yù)測和深度學(xué)習(xí)等多種策略,在藏羚基因組上共注釋到28,330個功能基因。綜上,通過多種技術(shù)手段,首次獲得了藏羚染色體水平的高質(zhì)量基因組和注釋信息,為藏羚的適應(yīng)進化遺傳機制、保護遺傳學(xué)研究及進一步探索物種遷徙行為的遺傳機制提供了重要的基因組資源。
相關(guān)研究結(jié)果以?A high-quality chromosome-level reference genome assembly of Tibetan antelope?。≒antholops hodgsonii) 為題,于11月12日在Nature旗下綜合性科學(xué)期刊Scientific Data(中國科學(xué)院二區(qū))在線發(fā)表。西北高原所博士研究生徐波和青海大學(xué)陳家瑞副教授為共同第一作者,西北高原所張同作研究員和青海大學(xué)魏青副教授為共同通訊作者。該工作得到青海省自然科學(xué)基金團隊項目(2023-ZJ-901T)的資助。
論文鏈接:https://www.nature.com/articles/s41597-024-04089-z
藏羚基因組的組裝和注釋結(jié)果
藏羚的基因組特征及與近緣物種之間的基因組共線性結(jié)果