Internacionales

1.5% de genes, ¿resto es ADN “chatarra”?

* Hay mucha más información que la que finalmente se traduce en genes * Un mundo de posibilidades si tomamos en cuenta que se cree hay 22 mil genes y una ristra de 3,000 millones de pares de bases

Madrid / EL PAÍS
A medida que se adentran en los entresijos del genoma humano los investigadores van encontrando un grado de complejidad mayor. Es una regla que se está cumpliendo, una vez más, con los resultados del consorcio internacional Encode (acrónimo construido con Enciclopedia de Elementos de ADN), iniciado en 2003 para catalogar todos los elementos presentes en el genoma que cumplen una función biológica.
Es un objetivo ambicioso pero que ya está dando sus primeros frutos, presentados en la IV Conferencia Europea de Biología Computacional celebrada recientemente en Madrid. Los investigadores han descubierto que en el genoma se lee mucha más información de la que finalmente se traduce en genes. Nadie sabe aún por qué, pero para algunos indica que habría que replantear el concepto de gen.
El ADN “chatarra”
Ya desde que se publicó el primer borrador del genoma humano, en 2001, los investigadores sospechan que no todos los elementos funcionales del genoma están en los genes. Antes de tener el genoma se estimaba que debía haber entre 100,000 y 150,000 genes humanos, pero la cifra final resulta estar próxima a los 22,000, aunque aún no se sabe exactamente, porque las señales que marcan en el genoma dónde está un gen son a veces demasiado difíciles de detectar para las computadoras. En cualquier caso, los genes son alrededor de un 1,5% del genoma, y el resto suele llamarse ADN chatarra o ADN basura.
Pero en los últimos años se han encontrado “fuertes evidencias” --informa Encode-- de que “otras partes del genoma tienen funciones importantes, aunque hay muy poca información sobre dónde están y cómo trabajan estos otros elementos funcionales”.
Encontrarlos es el objetivo del citado consorcio, integrado por muchos de los organismos que participaron en la secuenciación del genoma. Pero se reconoce que no es fácil. Uno de los principales obstáculos es que no hay un único método experimental al que recurrir, sino que deben de combinarse muchos, algunos demasiado caros para aplicarlos a la ristra de 3,000 millones de pares de bases que es el genoma humano.
Además, muchos elementos funcionales sólo están activos en algunos tipos de células o en etapas precisas del desarrollo, lo que implica que hará falta analizar muchos tipos de muestras biológicas.
Por ahora, en una fase piloto que durará aún un año más, los investigadores han decidido concentrarse en 44 regiones que cubren en total un 1% del genoma, unos 30 millones de pares de bases. Y los resultados están alimentando ya discusiones científicas.
Tom Gingeras, de la empresa Affimetrix, expuso en el congreso de Madrid uno de los más llamativos. “La lista que tenemos hoy de ADN que se transcribe en ARN, el transcriptoma, no está completa. Hay mucho ADN que se transcribe en ARN que no codifica para proteínas. Lo que vemos es que hay el doble de transcripción de lo que esperaríamos, y sospechamos que debe de haber mucha más aún”, dice Gingeras.
Las preguntas surgen enseguida. Si no codifica para proteínas, ¿para qué sirve este ARN? Aún no hay respuesta. Y es aquí donde empieza el debate. El ARN es la molécula formada por una sola hebra de bases químicas que hace de templete para trasladar la información del ADN a la máquina de ensamblado de proteínas de la célula.
Relación con origen de la vida
Pero Gingeras defiende que debe de hacer mucho más que eso. “No es nada insólito atribuir muchas funciones a la molécula de ARN”, afirma este experto, y recuerda que una de las hipótesis acerca del origen de la vida en la Tierra se basa en las múltiples capacidades de la molécula de ARN.
Es una opinión que comparte Alfonso Valencia, director del Instituto Nacional de Bioinformática (INB) y uno de los organizadores del congreso: “Durante los últimos años se ha hecho evidente que hay ARN que no producen proteínas y son muy importantes. Lo que no se sabía es que hubiera tantos y de clases tan diversas”.
Una postura en el debate, por tanto, es que la función de este ARN que no se traduce en proteínas es importante, aunque aún no se sepa cuál es. Gingeras relaciona el hallazgo de este ARN extra con otros recientes, como el de que un mismo gen puede transcribirse de maneras diferentes y, por tanto, dar lugar a proteínas distintas. De ahí concluye que tal vez haya que replantearse el concepto de gen.
“La definición de gen tiene un significado específico, es la parte del genoma que transfiere la información. Pero ahora sabemos que una porción del genoma puede dar lugar a proteínas muy distintas. ¿Son entonces genes distintos? Y si lo hacen, ¿multiplicamos el número de genes por el número de versiones de cada uno? Pero tal vez el átomo del genoma, lo que determina el fenotipo, no es el gen, lo que se transcribe. Y si es así, ¿incluimos también a los ARN que no se traducen en proteínas? ¡Tal vez tengamos cientos de miles de genes!”, dice Gingeras.
Ewan Birney, del Laboratorio Europeo de Biología Molecular, no está de acuerdo. “Ahora ya me creo los datos, son correctos. Efectivamente, hay más transcripción. Pero es algo que no tiene ningún efecto sobre el fenotipo y por tanto la evolución no lo ve”.
Se trata, dice, de una transcripción neutral, y Birney la relaciona con un fenómeno en cierto modo opuesto al de que un mismo gen dé lugar a muchas proteínas distintas: el de que dos secuencias --dos genes-- distintas, puedan dar lugar a proteínas con la misma función. “En los sesenta se pensaba que cada aminoácido es clave para la evolución, pero en los setenta se vio que no, que la mayoría de los cambios en los aminoácidos no es importante, es neutral. Yo traslado este concepto a otros niveles de información en el genoma, además de en la secuencia”, explica Birney.
Pero ¿de verdad no generan cambios en el fenotipo de un organismo los ARN que no se traducen en proteínas? Gingeras no está seguro. “Tenemos una tendencia enorme a clasificar como no relevante lo que no entendemos. En este caso tal vez simplemente no sepamos medir el efecto de lo que se transcribe en el organismo, no tengamos aún el instrumento para hacerlo”.
A Valencia le interesa especialmente otra nueva forma de entender el gen, una forma más “probabilística”. Los genes en el genoma no tienen una estructura clara, una secuencia de bases que empieza y termina y ya está; generalmente las partes del gen que se traducen, los exones, están interrumpidas por bases que no se leen --los intrones--.
A la hora de ser traducidos no siempre se tienen en cuenta todos los exones del gen, y esa es una de las razones por las que las proteínas producto del mismo gen puedan ser distintas. Los investigadores aún no saben por qué a veces un gen es traducido de una forma y a veces de otra. “Tal vez un gen sea la probabilidad con la que se asocian esos fragmentos, una proporción que puede cambiar en una enfermedad como el cáncer, modificando el tipo de proteínas que se producen”, dice Valencia.