并非化石
很多研究人员并不知道人类基因组中依然存在着各类逆转座子,而在知道的人中,亦有不少仅仅当这些逆转座子为基因组上已经失活的化石,从而使这些人体中的逆转座子所获的关注甚至少于细菌中的。然而实际上,人类基因组中的逆转座子不仅依然“健在”,甚至在人体中发挥着至关重要的作用。让我们一起为人类基因组中的这些逆转座子正名吧。
首先,人类基因组中的逆转座子如Alu元件和长散在元件(LINE-1),其并非化石,而是目前仍具有十足活性的逆转座子1,2。在人体胚胎细胞中、出生后的干细胞乃至肿瘤细胞中,均可见长散在元件及短散在元件(SINE)如Alu元件的高表达3-6。Alu元件和长散在元件(LINE-1)在新生儿中的非预期插入率分别为每20个新生儿一个和每200个新生儿一个7,8,这一现象同样说明人体中的逆转座子仍具有活性。此外,LINE-1在人体胚胎中的作用极其重要,对其进行抑制可造成胚胎发育的停止9。
并非寄生虫
同时,人类基因组上的这些逆转座子亦并非基因组上单纯的“寄生虫”。由ORF2p介导进行逆转座活动的人类基因组上的逆转座子自发现至今均被认为仅可随机选择基因组上固定的“TTAAAA”位点进行剪切和插入,无明显靶向性及功能,类似于基因组上的寄生虫。然而关于逆转座子的寄生虫学说有几大矛盾之处。
首先是如上文所述,若逆转座子在胚胎发育时期处于高表达,那缘何高表达下却仅得到低插入率(每20个新生儿一个和每200个新生儿一个)?我们是否始终未摸清这些逆转座子真正的作用方式?
二是目前已知的逆转座子的基因组插入机制矛盾。体外实验显示,ORF2p除外5′-TTTT/AA-3’亦可剪切其他多种序列10。然而实际上,其在基因组上所进行剪切的序列均为5′-TTTT/AA-3’,而“AAAA”和“TT”则正好分列于Alu元件所转录产生的RNA的二级“Ω”型结构的两脚上,提示ORF2p的剪切是具有序列特异性的并与其所结合核酸所形成的二级结构相关。此外,除外5′-TTTT/AA-3’,人类基因组上ORF2p所剪切的其他序列(5′-CTTT/AA-3’、5′-TCTT/AA-3’、5′-TTCT/AA-3’及5′-TTTC/AA-3’)10,也与各活性Alu元件3’部分RNA的“Ω”型二级结构一侧腿部(右腿)上的多聚A序列中的序列(“AAAG”、“AAGA”、“AGAA”及“GAAA”)相匹配(互补),进一步印证了ORF2p基因组剪切具有一定的序列特异性。
Alu元件转录产物RNA在CNV延伸机制中的剪接位点(绿色)、内切识别序列(红色)(黑色线条标示分列于“Ω”结构两脚上的识别序列)及内切作用二级结构“Ω”(蓝色)
图片摘自Häsler J, Strub K. Alu elements asregulators of gene expression [published correction appears in Nucleic AcidsRes. 2007;35(4):1389]. Nucleic Acids Res. 2006;34(19):5491-5497.doi:10.1093/nar/gkl706
ORF2p于基因组上所造成的实际插入序列,红框标出“Ω”结构一侧的识别序列
图片摘自Cost, G. J., and Boeke, J. D. (1998). Targeting ofhuman retrotransposon integration is directed by the specificity of the L1endonuclease for regions of unusual DNA structure. Biochemistry 37,18081–18093. doi: 10.1021/bi981858s
人类基因组上各类Alu元件序列,部分ORF2p结合序列用红框标出,可见其与上述ORF2p于基因组上所造成实际插入序列相匹配。序列摘自NCBI
- 此外,对于ORF2p如何在逆转座过程中将DNA单链转化为DNA双链,以及如何在切开基因组的一条链后继续切开另一条链并最终插入至基因组中,此前尚不明确;其中一个理论研究了ORF2p在切开基因组第一条链(识别序列为5′-TTTT/AA-3’)后若在原位切开第二条链,ORF2p需要识别的第二条链上的剪切序列。结果显示第二条链上由ORF2p识别并剪切的序列并无甚规律11,12,这亦与前述ORF2p的剪切规则明显矛盾。虽矛盾明显,但该理论指导下的逆转座子基因组插入机制仍成为了目前最主流的理论。实际上,若不纠结于逆转座子必须在切开基因组第一条链的原位切开第二条链并插入基因组,而是在切开第一条链并借此进行RNA到单链DNA的转化后,所产生的单链DNA脱离该处并转移至另一处继续进行符合ORF2p作用规律(切开基因组第一条链时所遵循的规则)的作用,则一切都合理了。
ORF2p的实际作用机制(图片为锐湃尔基因编辑技术原理简图)
三是逆转座子在人类基因组上占据了大片的区域。逆转座子与内含子共分去了基因组大部分的区域13,14。同时,由古至今的所有多细胞生物,其基因组中均存在具有活性的逆转座子(长散在元件及短散在元件)。如此在时间和空间上均十分惹眼的成分,很难认定其为单纯的“寄生虫”。实际上,如上所述,LINE-1在人体胚胎中的作用即是其关键作用之一9。
误会从何而来
笔者个人认为,对于人体内逆转座子作用的误解或许源于对其逆转座机制的错误理解。绝大多数描绘人体内逆转座子机制的文章,其配图均类似于下图。
源自于Nature Reviews Genetics杂志上一篇关于Alu元件的综述15。
该图源自Nature Reviews Genetics杂志上发表的一篇关于Alu元件及其机制的综述,该文章忽略了Alu元件的二级结构并绘制了图片如上,易使人认为ORF2p的剪切对象单纯且固定的为“5′-TTTT/AA-3’”,而与Alu元件的序列及其转录和转化产物的二级结构无关。后世相关文章所绘制的示意图亦多依托此版本,该印象则因此流传了下来。
此外,昔日的主流观点认为基因组是固定不变的,而随着近年来越来越多基因组有规则变化的证据显现,这一观念才逐渐被撼动。而彼时认为人类基因组是不变的,自然亦不会认为人类基因组上的逆转座子会具有定向重构基因组的能力。以上因素最终逐渐促成了人类基因组逆转座子无用的固化观念。
参考文献
1 Streva VA, Faber ZJ,Deininger PL. LINE-1 and Alu retrotransposition exhibit clonal variation. Mobile DNA. 2013;4(1): 16. doi:10.1186/1759-8753-4-16.
2 de Andrade A, Wang M, Bonaldo MF et al. Genetic and epigenetic variations contributed by Alu retrotransposition. BMC genomics. 2011;12(617. doi:10.1186/1471-2164-12-617.
3 Martin SL. The ORF1 protein encoded by LINE-1: structure and function during L1 retrotransposition. Journal of biomedicine & biotechnology. 2006;2006(1): 45621. doi:10.1155/jbb/2006/45621.
4 Adeniyi-Jones S ,Zasloff M. Transcription, processing and nuclear transport of a B1 Alu RNA species complementary to an intron of the murine alpha-fetoprotein gene. Nature. 1985;317(6032): 81-84. doi:10.1038/317081a0.
5 Kerachian MA ,Kerachian M. Long interspersed nucleotide element-1 (LINE-1) methylation in colorectal cancer. Clinica chimica acta; international journal of clinical chemistry. 2019;488(209-214. doi:10.1016/j.cca.2018.11.018.
6 Whongsiri P, Goering W,Lautwein T. Many Different LINE-1 Retroelements Are Activated in Bladder Cancer. 2020;21(24). doi:10.3390/ijms21249433.
7 Xing J, Zhang Y, Han K et al. Mobile elements create structural variation: analysis of a complete human genome. Genome research. 2009;19(9): 1516-1526. doi:10.1101/gr.091827.109.
8 Cordaux R, Hedges DJ, Herke SW et al. Estimating the retrotransposition rate of human Alu elements. Gene. 2006;373(134-137. doi:10.1016/j.gene.2006.01.019.
9 Percharde M, Lin CJ, Yin Y et al. A LINE1-Nucleolin Partnership Regulates Early Development and ESC Identity. Cell. 2018;174(2): 391-405.e319. doi:10.1016/j.cell.2018.05.043.
10 Cost GJ ,Boeke JD. Targeting of human retrotransposon integration is directed by the specificity of the L1 endonuclease for regions of unusual DNA structure. Biochemistry. 1998;37(51): 18081-18093. doi:10.1021/bi981858s.
11 Mathias SL, Scott AF, Kazazian HH, Jr. et al. Reverse transcriptase encoded by a human transposable element. Science (New York, N.Y.). 1991;254(5039): 1808-1810. doi:10.1126/science.1722352.
12 Wallace N, Wagstaff BJ, Deininger PL et al. LINE-1 ORF1 protein enhances Alu SINE retrotransposition. Gene. 2008;419(1-2): 1-6. doi:10.1016/j.gene.2008.04.007.
13 Sullivan JC, Reitzel AM,Finnerty JR. A high percentage of introns in human genes were present early in animal evolution: evidence from the basal metazoan Nematostella vectensis. Genome informatics. International Conference on Genome Informatics. 2006;17(1): 219-229.
14 Lander ES, Linton LM, Birren B et al. Initial sequencing and analysis of the human genome. Nature. 2001;409(6822): 860-921. doi:10.1038/35057062.
15 Batzer MA ,Deininger PL. Alu repeats and human genomic diversity. Nature reviews. Genetics. 2002;3(5): 370-379. doi:10.1038/nrg798.