Investigación
06/05/13 17:43

La lectura del genoma del lince, dos años de intenso trabajo

A principios de 2013 ha comenzado la fase de ensamblaje del puzzle tras completarse la fase de obtención de datos
Imagen de archivo de la camada de Dama procedente del programa de cría en cautividad.

El equipo de Lynxgenomics ha apostado por las nuevas técnicas de secuenciación como vía para ensamblar el genoma del lince ibérico. La secuenciación es la clave del proceso de reconstrucción del genoma de todo ser vivo. Con ella se pretenden colocar ordenadamente las aproximadamente 3000 millones de bases o letras de las que está compuesto un genoma en cada uno de sus cromosomas (19 pares en lince frente a los 23 que tenemos los humanos).

Las nuevas tecnologías de secuenciación que se están utilizando en el proyecto Lynxgenomics, aunque proporcionalmente mucho más económicas, generan trozos muy cortos de ADN en torno a las 100 bases cada uno. Por tanto, estamos ante el reto de ensamblar un gran puzzle o ante una novela cuyas páginas hubieran pasado por una trituradora de papel y hubiera que recomponer. Una tarea de gran complejidad y de un elevado grado de dificultad, debido no sólo al tamaño del genoma, sino también a que éste está repleto de secuencias con motivos repetitivos que pueden ser de muy distinto tamaño y que pueden aparecer dispersos o en asociados en tándem.

Para abordar este reto se han utilizado las dos tecnologías de referencia en el mercado actual, las de Illumina y la 454 de Roche, y se han utilizado dos estrategias complementarias:

La primera consiste en generar pares de secuencias cortas que se saben separadas por una distancia conocida en el genoma. Estas secuencias apareadas pueden utilizarse como 'grapas' de distintas dimensiones para la construcción del texto global. Serían como frases cortas de la novela que se saben separadas por un número conocido de palabras. Esto ayuda enormemente a situar dichas frases en la novela, incluso si una misma aparece en distintos sitios. En la estrategia estándar esta distancia es de unas 500 bases o letras, lo que ayuda a colocar en el sitio correcto secuencias repetidas de una longitud menor a las 500 bases. .

Además, para el proyecto de secuenciación del genoma del lince ibérico se han obtenido también secuencias separadas por 4000, 5200 y 40000 bases. Para este último caso se han usado genotecas, colecciones de fragmentos del genoma de lince que se insertan en bacterias para conservarlos. Dichas genotecas fueron previamente construidas por el grupo del profesor José Luis García en el Centro de Investigaciones Biológicas (CIB) del CSIC en Madrid.

La segunda estrategia reduce la complejidad del problema aprovechando estas mismas genotecas. La idea es secuenciar y ensamblar un número limitado de estos fragmentos cada vez, intentando cubrir de esta manera todo el genoma en bloques solapantes de 40.000 bases. El proceso, según explica el coordinador del proyecto Lynxgenomics, José Antonio Godoy, es bien diferente del anterior, ya que "antes el ordenador partía de pequeñas frases que podían ir en cualquier lugar de la novela, mientras que ahora digamos que podemos asumir que proceden de solo 1.200 páginas tomadas al azar, por lo que se reduce sustancialmente la complejidad del problema. Se intentaría reconstruir en una primera fase decenas de lotes de 1200 páginas, para después intentar reconstruir el orden de las páginas en una segunda fase".

En todo el proceso de obtención de datos de secuencia se han empleado dos años, culminando a finales de 2012. Una vez obtenidos todos estos datos, queda la difícil tarea de ensamblarlos, proceso que ha dado comienzo a principios de 2013.

Cuando el trabajo de ensamblaje culmine tendremos un mapa del genoma 'mudo', es decir, en blanco. La última fase será la de 'anotación', esto es, añadir leyendas al mapa que indiquen la localización de los genes y otros elementos funcionales y estructurales en el complejo mapa del genoma.

Idiomas disponibles: Inglés
El genoma al completo

El principal objetivo de esta investigación es generar el primer genoma de un lince, que nos brindará una importante información sobre el mecanismo de transmisión de la información genética, la evolución de esta especie, el declive de su diversidad biológica y sus consecuencias.

Las piezas genéticas han sido identificadas en la EBD y mandadas a la CNAG, el organismo responsable de colocarlas en el orden correcto (secuenciación). Cuando se culmine el proceso en 2012 los científicos deberán afrontar un nuevo reto: interpretarlo y compararlo con los genomas de otros felinos.

Lynxexitu
 
Powered by