search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

對「非編碼 DNA」的最新研究成果包含了哪些具體內容?

人類基因組計劃HGP與DNA元件百科計劃ENCODE

人類基因組計劃(HGP)在2001年宣布對人類的全基因組進行了測序,獲得了近乎完整的人類DNA。人類估計有大約20,000個編碼蛋白質的基因,占人類基因組的1.5%,剩餘的98.5%都為非編碼序列。然而非編碼區廣泛存在於真核生物中,且眾多的非編碼區在生命活動中具有非常廣泛的調控作用。因此一項名為ENCODE-「DNA元件百科全書」的計劃(encyclopedia of dna elements)於2003年9月由美國國立人類基因組研究所啟動,開始了對基因組剩餘部分(非編碼區)的解析的工作。全世界11個國家80家科研機構35個小組的研究人員通過了十幾年的奮鬥產生了許多令人驚訝的發現,提供了詳盡的非編碼功能單位的功能圖譜,並表示在98%的非編碼基因中有87%是功能性的。

genome.gov/pages/research/encode/nature05874.pdf

非編碼DNA不等於垃圾DNA

「垃圾DNA」這個概念是在上世紀70年代提出來的,用來形容那些基因組中不編碼蛋白質的DNA序列,而在學術上被稱為非編碼DNA序列。

由於當時在科研圈裡普遍認為有生物學意義的蛋白質才是決定生物性狀的關鍵,而且也沒有一種好的理論和技術手段來解釋這些「垃圾」存在的原因,於是「垃圾DNA」這一觀念便形成並逐漸根深蒂固。

後來ENCODE計劃中的科學家們發現,人類基因組中包含多達400萬個基因開關和功能調節因子,而它們就在被人們認為是「垃圾」而不予理睬的DNA中。

這個結果強烈地衝擊了「DNA序列=生物性狀」的傳統觀點。每個基因對應著差不多200種各類型的調節方式,而不同的調節方式又決定著生物性狀的差異,那麼真正影響生物性狀的,或者說生物精髓的就不該是DNA序列,而是那些豐富的調節方式。而且人類之所以複雜不在於更多的基因,而在於更複雜的調控機制。

@吳亮在染色體數最多,DNA所含總信息量最大的生物分別是什麼?這個問題下,對生物中基因組的複雜程度做了一個解釋,可以看出即使是在植物中存在的大量重複序列本身也是一種調控信息,因此可以看出真正影響我們複雜性狀與行為背後應該也有著更加複雜的基因調控手段。

非編碼DNA與全基因組DNA比率對比圖,可以看出人類的比例是最高的。

也就是說,人們已經認識到,這些非編碼DNA雖然不直接編碼蛋白質,卻可能是是負責調控一些基因表達的「開關」。

科研界過去一直認為一條能被翻譯成蛋白質的DNA序列就是基因。但是現在根據ENCODE的研究,這個定義或該重新考慮。在我們體內存在著許多轉錄,比我們想象的都要多,而顯然之前被認為是毫無關聯的兩個基因現在被聯繫了起來。而這意味著,基因的邊界擴大了而基因間的間隙也在縮小甚至消失了。

而伴隨著這樣的界限的模糊和消失,把基因看作基因組中的基本單位這種觀點可能已經不再適合了,基因組的組成成分是轉錄,因此RNA轉錄或才是基本單位,受到了突變和選擇的影響。

這一發現為人類認識疾病提供了新的思路。疾病的發生,也許並不是某些基因的缺陷,而是複雜的調控網路出現了紊亂;人與人個體的差異,恰恰也是源於這種調控網路間的差異。

非編碼DNA的調節作用

非編碼DNA隨著我們對於DNA、基因等概念日益深入而逐漸淡出了我們的視野,大量研究顯示非編碼DNA序列中包含著大量功能性元件,可大致分為順式調節元件和產生非編碼RNA。

順式調節元件

順式作用元件(cis-acting element)存在於基因旁側序列中能影響基因表達的序列。順式作用元件包括啟動子、增強子、調控序列和可誘導元件等,它們的作用是參與基因表達的調控。順式作用元件本身不編碼任何蛋白質,僅僅提供一個作用位點,要與反式作用因子相互作用而起作用。

實際上在整個基因組中參與反應的酶、DNA序列都不像我們寫在書本中那樣單純的線性的或者平面的結構,他們有著高度複雜的三維空間構造。這使得在線性結構中相隔很遠的兩個基團能夠在三維空間內靠得很近,為基因的調控增加了許多可能。

在這裡就想講一下我們的腫瘤細胞了,目前認為體內絕大多數腫瘤的形成是原癌基因和抑癌基因突變導致的,但也有好幾種突變是發生在DNA非編碼區域的,其中有一種情況就是某原癌基因的啟動子或者增強子發生了變化。Science就對某一種T細胞急性淋巴細胞白血病(T cell acute lymphoblastic leukemias, T-ALL)進行了報道,部分患者的DNA突變導致了一個超級增強子的產生。

增強子可能出現在其轉錄起點的上游或下游,且強弱與距離無關。DNA轉錄、複製過程中酶是必不可少的條件之一。增強子的存在能夠更好地「卡住」轉錄酶,使酶更易與啟動子相結合,有利於DNA轉錄地進行。

超級增強子(Super-enhancers)這個概念是2013年Richard A. Young實驗室所提出的,我們可以簡單地把超級增強子理解為增強子和大量輔助因子、轉錄因子和活性相關蛋白等的組成的具有複雜結構的功能團,其組成結構使之能夠結合大量RNA聚合酶Ⅱ,轉錄水平也會大大提高,近年大量研究指出部分腫瘤形成與超級增強子的形成密不可分。

左邊紅色的是ASCC3基因所轉錄而成的mRNA廣泛分佈在胞漿中,右邊紅色的同樣是ASCC3基因產生轉錄而成的非編碼RNA大量聚集在細胞核中。

L. Williamson et al., 「UV irradiation induces a non-coding RNA that functionally opposes the protein encoded by the same gene,」 Cell, doi:10.1016/j.cell.2017.01.019, 2017.

這篇發表於cell上的一篇文章表示同一基因的轉錄產物可以是蛋白也可以是非編碼RNA,非編碼RNA還可幫助細胞從DNA損傷中恢復。

另外端粒這種廣泛存在於真核細胞線性染色體末端的DNA高度重複序列也可以看作是一種非編碼DNA,不編碼任何蛋白但其作用是保持染色體的完整性和控制細胞分裂周期。對端粒感興趣的話可以看我們之前回答的關於端粒與衰老之間關係的回答。人體衰老,體內 DNA 也隨之衰老嗎?

非編碼RNA

而還有很大一部研究集中在由非編碼DNA轉錄而來的非編碼RNA(noncoding RNA, ncRNA),非編碼RNA在基因表達中發揮重要的作用,在不同的水平上調控基因的表達,影響整個生命的活動。

按照它們的大小可將它們分為長鏈非編碼RNA(Long noncoding RNA, LncRNA)和短鏈非編碼RNA

非編碼RNA對基因進行調控

近年來通過對已發現的lncRNA的研究表明,lncRNA能夠在多種層面調控基因的表達水平,其調控機制開始為人們所揭示,而短鏈RNA同樣可以在基因組水平對基因表達進行調控,其可介導mRNA的降解,誘導染色質結構的改變,決定著細胞的分化命運,還對外源的核酸序列有降解作用以保護本身的基因組。常見的短鏈RNA為小干涉RNA(short interfering RNA, siRNA)和微小RNA(microRNA, miRNA),前者是RNA干擾的主要執行者,後者也參與RNA干擾但有自己獨立的作用機制。

非編碼RNA不僅能對整個染色體進行活性調節,也可對單個基因活性進行調節,它們對基因組的穩定性、細胞分裂、個體發育都有重要的作用。

在哺乳動物的基因組中只有2%的區域編碼mRNA,其它98%的非編碼區轉錄產物大部分就是長鏈和短鏈的非編碼RNA(ncRNA)。這種現象直接挑戰了認為RNA是DNA與蛋白質之間的中間環節的傳統觀念,並且表明長期以來被認為是垃圾的基因組大部分區域其實有著重要的生物學作用。

最後想說的是人類的科研過程總是伴隨著不斷地認知更新,過去被認為是垃圾的非編碼DNA現在被證明80%以上都是具有生物學功能的,而剩下那20%也不能說就真的是完全沒有功能了,或許也只是因為現在的研究手段有限讓我們無法探清他們的功能。

PS:最近又有文獻報道說一部分LncRNA可以編碼小肽,而這或許說明隨著研究的深入越來越多的曾被認為無用的基因序列都會被找到相應的作用,有用與無用更多的是看我們能不能發現。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦