Es básico para analizar la información que puedan aportarnos

Saber cuántos genes tenemos está poniendo patas arriba la ciencia

Unos quince años después de la secuenciación del genoma humano, los investigadores todavía no pueden ponerse de acuerdo acerca de cuántos genes contiene.

Tal y como relata Nature, en 2000, cuando aún se estaba preparando un proyecto de secuencia del genoma humano; los genetistas realizaron un sorteo sobre cuántos genes tienen los humanos, y las apuestas variaron de decenas de miles a cientos de miles.

Casi dos décadas después, los científicos armados con datos reales todavía no pueden ponerse de acuerdo sobre el número, una brecha de conocimiento que dicen obstaculiza los esfuerzos para detectar mutaciones relacionadas con la enfermedad.

El último intento de cerrar esa brecha utiliza datos de cientos de muestras de tejido humano. Incluye casi 5.000 genes que no han sido detectados previamente, entre ellos casi 1.200 que llevan instrucciones para fabricar proteínas. Y el recuento total de más de 21.000 genes que codifican proteínas es un salto sustancial ante las estimaciones previas, que sitúan la cifra en alrededor de 20.000.

Pero muchos genetistas aún no están convencidos de que todos los genes recién propuestos resistirán el escrutinio. Sus críticas subrayan lo difícil que es identificar nuevos genes, o incluso definir qué es un gen.

Difícil de precisar

El recuento de genes puede variar según los datos que se analicen, las herramientas utilizadas y los criterios para descartar falsos positivos. El recuento más reciente utilizó un conjunto de datos más grande y diferentes métodos computacionales de esfuerzos anteriores, así como también criterios más amplios para definir un gen.

El equipo de Steven Salzberg, un biólogo computacional de la Universidad Johns Hopkins en Baltimore, utilizó datos del proyecto Genotype-Tissue Expression (GTEx), que secuenció el ARN de más de 30 tejidos diferentes tomados de varios cientos de cadáveres.

El ARN es el intermediario entre el ADN y las proteínas. Los investigadores querían identificar los genes que codifican una proteína y los que no lo hacen, pero aún así cumplen una función importante en las células. Entonces ensamblaron los 900 mil millones de diminutos fragmentos de ARN de GTEx y los alinearon con el genoma humano.

Sin embargo, el hecho de que un tramo de ADN se exprese como ARN no necesariamente significa que sea un gen. Entonces el equipo intentó filtrar el ruido usando una variedad de criterios. Por ejemplo, compararon sus resultados con genomas de otras especies, razonando que las secuencias compartidas por criaturas distantemente relacionadas probablemente se hayan preservado por la evolución porque sirven para un propósito útil, y por lo tanto es probable que sean genes.

El equipo se quedó con 21.306 genes que codifican proteínas y 21.856 genes no codificantes, muchos más de los incluidos en las dos bases de datos de genes humanos más utilizadas.

Kim Pruitt, investigador del genoma en el NCBI en Bethesda (EEUU), dice que la diferencia probablemente se deba en parte al volumen de datos analizados por el equipo de Salzberg

El grupo de Salzberg se basó únicamente en programas informáticos para tamizar los datos.

Difícil Recuento

Tener un recuento exacto de todos los genes humanos es importante para los esfuerzos por descubrir los vínculos entre los genes y la enfermedad. Los genes que no se tienen en cuenta a menudo se ignoran, incluso si contienen una mutación que causa una enfermedad, dice Salzberg.

Pero agregar genes apresuradamente a la lista maestra también puede presentar riesgos, dice Frankish. Un gen que resulta incorrecto puede desviar la atención de los genetistas del problema real.

 

Te puede interesar

CONTRIBUYE CON PERIODISTA DIGITAL

QUEREMOS SEGUIR SIENDO UN MEDIO DE COMUNICACIÓN LIBRE

Buscamos personas comprometidas que nos apoyen

COLABORA

Lo más leído