Na moderna bioloxía molecular e na xenética, dáse o nome de xenoma (pronunciado / ʃenóma /, do grego γένος, genos, 'raza', 'que xera'), ou ADN nuclear (ADNn), ao conxunto completo de toda a información hereditaria dun organismo ou especie con todos os seus xenes e outros elementos non codificantes[1].
Normalmente está codificado no ADN, pero en certos tipos de virus no ARN.
A introdución do termo xenoma fíxoa en 1920 Hans Winkler,[2] profesor de botánica da Universidade de Hamburgo, Alemaña, tomando a raíz da palabra xene e a terminación -oma que aparece noutras palabras como cromosoma ou bioma.[3]
O estudo das propiedades globais dos xenomas de organismos relacionados denomínase xenómica, que se distingue da xenética, que xeralmente estuda as propiedades dun determinado xene ou grupo de xenes.
O termo xenoma pode aplicarse especificamente co significado de xenes e elementos xenéticos que se encontran nos cromosomas nucleares (no caso dos eucariotas) polo que equivale a "xenoma nuclear" (de aí o sinónimo moitas veces empreagado de ADN nuclear). Pero pode aplicarse tamén ao xenoma contido dentro de orgánulos con ADN propio como as mitocondrias e cloroplastos, o que sería o "xenoma mitocondrial" ou "xenoma do cloroplasto".
Nos procariotas, como as bacterias, ademais do xenoma contido no seu cromosoma único adoitan ter outros ADNs extracromosómicos adicionais, como poden ser, por exemplo, plásmidos e virus integrados, que moitas veces se secuencian tamén e estes datos inclúense nos dos seus xenomas.[4]
Cando se secuencia o xenoma dos organismos eucariotas diploides (ou tamén poliploides) con reprodución sexual, o que se determina é a secuencia dun conxunto completo haploide de cromosomas de modo que inclúa todos os autosomas e os dous cromosomas sexuais. Para facer a secuenciación do xenoma xeralmente tómanse e analízanse mostras de varios individuos.
O xenoma humano consta de 3 200 millóns de pares de bases e de 20 000 a 25 000 xenes e miles doutros elementos xenéticos como pseudoxenes, transposóns, HERVs, ADN satélite etc.
En 1976, Walter Fiers na Universidade de Gante (Bélxica) foi o primeiro que estableceu a secuencia nucleotídica completa dun xenoma, que era o pequeno xenoma de ARN do virus bacteriófago MS2. O seguinte ano, Fred Sanger completou o do fago ΦX174, de só 5386 pares de bases, que foi o primeiro xenoma de ADN secuenciado. As primeiras secuencias xenómicas completas con representantes dos 3 dominios da vida foron realizadas a mediados da década de 1990. O primeiro xenoma bacteriano secuenciado foi o de Haemophilus influenzae, en 1995 polo Institute for Genomic Research. Poucos meses despois, un equipo con dirección europea, que levaba traballando desde mediados da década de 1980, completou o primeiro xenoma eucariótico, de 16 cromosomas do lévedo Saccharomyces cerevisiae. Pouco despois, en 1996, rematouse a primeira secuencia xenómica dunha arquea, Methanococcus jannaschii, outrra vez polo Institute for Genomic Research.
O desenvolvemento de novas tecnoloxías fixo moitísimo máis fácil, rápido e barato a secuenciación de xenomas, e o número de secuencias xenómicas completas está a crecer rapidamente. Os Institutos Nacionais da Saúde dos Estados Unidos manteñen unha das varias bases de datos que hai con información xenómica.[5] Entre os miles de proxectos de secuenciación de xenomas completados están o do xenoma do rato, arroz, a planta Arabidopsis thaliana, o peixe globo, e a bacteria Esherichia coli.
As novas tecnoloxías de secuenciación, como a secuenciación paralela masiva abren a posibilidade non xa de secuenciar os xenomas de especies senón de secuenciar os xenomas persoais de individuos como ferramenta de diagnóstico, como propón Manteia Predictive Medicine. Un paso importante cara a ese obxectivo foi completar en 2007 o xenoma completo do científico James D. Watson, un dos codescubridores da estrutura do ADN.[6]
A secuenciación dun xenoma determina a orde en que están situadas as bases do ADN no xenoma, pero despois hai que facr o mapado, que identifica a situación dos puntos de referencia principais do xenoma. Un mapa xenómico é menos detallado que a secuencia xenómica pero axuda á navegación polo xenoma. O Proxecto Xenoma Humano tivo cmo obxectivo mapar e secuenciar o xenoma humano. Un paso fundamental neste proxecto foi a publicación primeiro dun mapa xenómico detallado por Jean Weissenbach e o seu equipo de Genoscope de París.[7][8]
A composición do xenoma describe a composición dos contidos do xenoma haploide, o que inclúe o tamaño do xenoma, e as proporcións de ADN non repetitivo e repetitivo que presenta en detalle. Comparando as composicións de distintos xenomas, os científicos poden comprender mellor a historia evolutiva dun xenoma dado.
Cando se fala sobre a composición dun xenoma, debe distinguirse entre procariotas e eucariotas pola gran diferenza de contido e estrutura que teñen. Nos procariotas, a maior parte do xenoma (85-90%) é ADN non repetitivo, o cal quere dicir que está formado principalmente por ADN codificante, mentres que as rexións non codificantes ocupan só unha pequena parte.[9] Polo contrario, os eucariotas presentan unha organizaciòn xenómica con intróns e exóns nos xenes que codifican proteínas; a variación do contido en ADN repetitivo en eucariotas é ademais extremadamente alta. De feito, nos mamíferos e plantas a maior parte do xenoma está composto por ADN repetitivo.[10]
A maioría das entidades biolóxicas que son máis complexas que os virus levan material xenético adicional ademais do que forma os seus cromosomas (plásmidos, ADN mitocondrial). Nalgúns contextos como a secuenciación de xenomas de microbios patóxenos, enténdese que o "xenoma" inclúe tamén ese material xenético adicional, como o dos plásmidos.
Nos eucariotas "xenoma" xeralmente se refire á información contida nos cromosomas do núcleo celular, sen incluír o ADN de mitocondrias e cloroplastos. O ADN mitocondrial forma o "xenoma mitocondrial", e o ADN cloroplástico denomínase "plastoma".
O tamaño xenómico é o número total de pares de bases de ADN nunha copia dun xenoma haploide. O tamaño do xenoma está correlacionado positivamente coa complexidade morfolóxica que presentan os procariotas e os eucariotas inferiores; porén, na maioría dos eucariotas superiores esta correlación xa non existe.[10][11] Este fenómeno indica a enorme influencia que ten o ADN repetitivo nos xenomas dos eucariotas superiores.
Estanse a facer traballos experimentais sobre xenomas mínimos, é dicir, co número mínimo de xenes con que un organismo pode sobrevivir, en organismos unicelulares e en xenomas animais. O traballo pode facerse in vivo e in silico (informaticamente). En Mycoplasma genitalium, unha bacteria cun xenoma mínimo, atopouse que dos seus 482 xenes codificantes de proteínas, polo menos 382 eran esenciais para a supervivencia.[12][13]
Tipo de organismo | Organismo | Tamaño do xenoma (pares de bases) |
Nota | |
---|---|---|---|---|
Virus | Circovirus porcino tipo 1 | 1.759 | 1,8kb | Virus máis pequeno que se replica autonomamente en células eucarióticas.[14] |
Virus | Bacteriófago MS2 | 3.569 | 3,5kb | primeiro xenoma de ARN secuenciado[15] |
Virus | SV40 | 5.224 | 5,2kb | [16] |
Virus | Fago ΦX174 | 5.386 | 5,4kb | Primeiro xenoma de ADN secuenciado[17] |
Virus | VIH | 9.749 | 9,7kb | [18] |
Virus | Fago λ | 48.502 | 48kb | Utilizado a miúdo como vector para a clonación de ADN recombinante. |
Virus | Megavirus | 1.259.197 | 1,3Mb | O maior xenoma viral coñecido.[22] |
Bacteria | Haemophilus influenzae | 1.830.000 | 1,8Mb | Primeiro xenoma secuenciado dun organismo celular, xullo de 1995[23] |
Bacteria | Carsonella ruddii | 159.662 | 160kb | O xenoma non viral máis pequeno.[24] |
Bacteria | Buchnera aphidicola | 600.000 | 600kb | [25] |
Bacteria | Wigglesworthia glossinidia | 700.000 | 700Kb | |
Bacteria | Escherichia coli | 4.600.000 | 4,6Mb | [26] |
Bacteria | Solibacter usitatus (cepa Ellin 6076) | 9.970.000 | 10Mb | [27] |
Ameba | Polychaos dubium ("Amoeba" dubia) | 670.000.000.000 | 670Gb | O xenoma máis grande coñecido.[28] (pero estes datos son antigos e discutidos [29]) |
Planta | Arabidopsis thaliana | 157.000.000 | 157Mb | Primeiro xenoma de planta secuenciado, decembro de 2000.[30] |
Planta | Genlisea margaretae | 63.400.000 | 63Mb | Xenoma máis pequeno coñecido de planta con flor, 2006.[30] |
Planta | Fritillaria assyrica | 130.000.000.000 | 130Gb | |
Planta | Populus trichocarpa | 480.000.000 | 480Mb | Primeiro xenoma de árbore secuenciado, setembro de 2006[31] |
Planta | Paris japonica | 150.000.000.000 | 150Gb | O xenoma de planta máis grande coñecido |
Brión | Physcomitrella patens | 480.000.000 | 480Mb | Primeiro xenoma de briófito secuenciado, xaneiro de 2008.[32] |
Lévedo | Saccharomyces cerevisiae | 12.100.000 | 12,1Mb | Primeiro xenoma eucariótico secuenciado, 1996[33] |
Fungo | Aspergillus nidulans | 30.000.000 | 30Mb | |
Nematodo | Caenorhabditis elegans | 100.300.000 | 100Mb | Primeiro xenoma de animal pluricelular secuenciado, decembro de 1998[34] |
Nematodo | Pratylenchus coffeae | 20.000.000 | 20Mb | O xenoma animal máis pequeno coñecido[35] |
Insecto | Drosophila melanogaster (mosca da froita) | 130.000.000 | 130Mb | [36] |
Insecto | Bombyx mori (verme da seda -lepidóptero-) | 432.000.000 | 432Mb |
contén 14.623 xenes preditos[37] |
Insecto | Apis mellifera (abella do mel) | 236.000.000 | 236Mb | |
Insecto | Solenopsis invicta (formiga de fogo) | 480.000.000 | 480Mb | [38] |
Peixe | Tetraodon nigroviridis (tipo de peixe globo) | 385.000.000 | 390Mb | O xenoma de vertebrado máis pequeno coñecido [39][40] - 385 Mb.[41] |
Mamífero | Mus musculus | 2.700.000.000 | 2,7Gb | [42] |
Mamífero | Homo sapiens | 3.200.000.000 | 3,2Gb | Xenoma do Homo sapiens estimado en 3,2 miles de millóns de pares de bases [43]
Secuecnciación inicial e análise do xenoma humano[44] |
Peixe | Protopterus aethiopicus (un peixe pulmonado) | 130.000.000.000 | 130Gb | O xenoma de vertebrado máis grande coñecido |
A proporción de ADN non repetitivo calcúlase dividindo a lonxitude do ADN non repetitivo polo tamaño do xenoma. Os xenes que codifican proteínas e os que codifican ARNs xeralmente son ADN non repetitivo.[45] Que un xenoma sexa máis grande non quere dicir que teña máis xenes; de feito, a proporción de ADN non repetitivo decrece conforme aumenta o tamaño do xenoma en eucariotas superiores.[10]
A proporción de ADN non repetitivo pode variar moito entre especies. Algunhas cepas de E. coli e outros procariotas só teñen ADN non repetitivo, e eucariotas como o verme C. elegans e a mosca Drosophila melanogaster, posúen máis ADN non repetitivo que repetitivo,[10][46] pero os eucariotas superiores como os vertebrados teñen máis ADN repetitivo que non repetitivo. Nalgunhas plantas e anfibios, a proporción de ADN non repetitivo non é maior do 20%, polo que é un compoñente minoritario.[10]
Hai dúas categorías de ADN repetitivo no xenoma: as repeticións en tándem e as repeticións intercaladas (ou dispersas).[47]
As repeticións en tándem orixínanse xeralmente por "escorregamento" durante a replicación do ADN, sobrecruzamento desigual e conversión xénica.[48] O ADN satélite e os microsatélites son formas de repeticións en tándem presentes no xenoma.[49] Aínda que as repeticións en tándem supoñen unha porción significativa do xenoma, as repeticións máis abondosas nos mamíferos son do tipo das repeticións intercaladas.
As repeticións dispersas ou intercaladas proceden principalmente de elementos transpoñibles (como os transposóns), pero poden incluír tamén algunhas familias de xenes que codifican proteínas e pseudoxenes. Estes elementos poden copiarse e integrarse no xenoma noutro lugar distinto do que proceden.[9][50] Crese que os transposóns son unha forza importante que impulsa a evolución dos xenomas nos eucariotas superiores.[51] Os elementos transpoñibles poden clasificarse en dúas categorías: os de clase 1 (retrotransposóns) e os de clase 2 (transposóns de ADN).[50]
Os retrotransposón poden ser transcritos a ARN, os cales son despois duplicados en ADN e inseridos noutro sitio do xenoma.[52] Os retrotransposóns poden ser divididos en repeticións terminais longas (LTRs) e repeticións terminais non longas (Non-LTR).[51]
Os transposóns de ADN móvense no xenoma xeralmente polo sistema de "cortar e pegar", pero tamén se observou a duplicación. Os elementos transpoñibles de clase 2 non utilizan ARN como intermediario e son comúns en bacterias, e tamén se atoparon en metazoos.[51]
Os xenomas son máis que a suma dos xenes dun organismo e teñen características que poden ser medidas e estudadas sen facer referencia aos detalles de xenes determinados ou dos seus produtos. Pódense comparar características como número de cromosomas (cariotipo), tamaño do xenoma, orde dos xenes, nesgo no uso dos codóns, e contido GC para determinar cales puideron ser os mecanismos que orixinaron a gran variedade de xenomas que existe hoxe (ver na bibliografía adicional Brown 2002; Saccone e Pesole 2003; Benfey e Protopapas 2004; Gibson e Muse 2004; Reese 2004; Gregory 2005).
A duplicación de xenes xoga un papel primordial en darlle forma ao xenoma. A duplicación pode ser desde unha ampliación de repeticións curtas en tándem, ata a duplicación dun cluster de xenes, ou a duplicación de cromosomas enteiros ou de xenomas enteiros (poliploidía). Tales duplicacións son probablemente fundamentais para a creación de novidades xenéticas.
A transferencia horizontal de xenes pode explicar por que hai tanta semellanza entre pequenas porcións do xenoma de dous organismos que están moi afastados na árbore evolutiva. A transferencia horizontal de xenes parece ser moi común entre os microbios,[58] pero tamén os eucariotas experimentaron este tipo de transferencias desde outros organismos ou desde os xenomas dos seus cloroplastos e mitocondrias aos seus cromosomas nucleares.