Un poquito sobre el Proyecto Genoma Humano
Artículo extraído de la página web ENSAYOS SOBRE GENÉTICA y realizado por el Profesor Antonio Barbadilla, de la Universitat Autònoma de Barcelona.
El proyecto de secuenciación del genoma humano ha sido el mayor proyecto de investigación biomédica de la historia. Con una presupuesto inicial de 3 mil millones de dólares y la participación de un Consorcio Público Internacional, formado por EEUU, Reino Unido, Japón, Francia, Alemania, China y otros países, tenía como objetivo último la consecución de la secuencia completa del genoma humano, es decir, el texto lineal constituido por la secuencia de las cuatros bases químicas del ADN que contiene las instrucciones para construir un ser humano. Iniciado en 1990, el proyecto se dio por concluido en el 2003, dos años antes de lo previsto. Otros objetivos del proyecto eran la secuenciación de genomas de otros organismos modelos de los que había un amplio conocimiento previo, como la bacteria Escherichia coli, la levadura Saccaromyces cerevisiae, el gusano Caenorhabditis elegans, o la mosca del vinagre Drosophila melanogaster. También tuvo un papel destacado el estudio de las implicaciones éticas, legales y sociales que se derivarían de los resultados del proyecto. Ocho años después del inicio del proyecto público apareció en escena una empresa privada, Celera genomics, presidida por el brillante y revolucionario científico Craig J. Venter, que lanzó el reto de conseguir la secuencia humana en un tiempo récord, antes del previsto por el Consorcio Público. Proponía una estrategia de secuenciación alternativa a la secuenciación jerárquica que seguía el Consorcio, la secuenciación aleatoria (shotgun), con la que ya se había conseguido secuenciar el primer genoma celular en 1995, el de la bacteria Haemophilus influenzae. Empieza a partir de ese momento una carrera apasionante por la conquista del genoma humano, que acabaría finalmente en tablas. El 26 de Junio de 2000, en un acto auspiciado por el presidente Bill Clinton y que tuvo como escenario la Casa Blanca, se encontraron los dos máximos representantes de las partes en competición, Craig Venter por Celera, y el director del Consorcio Público, Francis Collins. Se anunció de forma conjunta la consecución de dos borradores de la secuencia completa del genoma humano. Las publicaciones correspondientes de ambas secuencias no aparecieron hasta Febrero de 2001. El Consorcio Público publicó su secuencia en la revista Nature, mientras que Celera lo hizo en Science. Tres años después, en 2004, el Consorcio publica la versión final o completa del genoma humano. El proyecto genoma humano había concluido con un éxito rotundo y, en palabras de F. Collins, se iniciaba una nueva era en la investigación biomédica basada en la genómica que afectaría crucialmente a la biología, a la salud y a la sociedad.
Cambios de escala en la investigación
El desciframiento de la secuencia del genoma humano fue posible por los cambios de escala en tres aspectos esenciales del proyecto que, al ser incorporados en la práctica de la investigación biomédica actual, la han transformado profundamente: (1) la producción de datos a gran escala, (2) el desarrollo de recursos computaciones potentes y robustos y (3) la sociología de la investigación biológica.
Tecnologías de gran rendimiento (high-throughput)
Las técnicas de manipulación genética que se empleaban en los laboratorios de forma rutinaria desde finales de los ochenta y en los noventa se lograron integrar en una cadena de producción a nivel industrial, permitiendo la generación de datos a gran escala. Los centros genómicos del proyecto genoma desarrollaron la robótica y la automatización de los miles de pasos de clonación y reacciones de secuenciación que se requerían para el ensamblaje de las secuencias de un organismo complejo. A partir de estos avances, se inicia una fase de aceleración continua, tanto en la velocidad de secuenciación como en la reducción del precio de los genomas, sin límites visibles. En el momento de redactar este texto hay unos 3900 genomas de especies distintas que están secuenciados o en proceso de secuenciación, pero este número será insignificante en pocos años, cuando el secuenciar genomas sea algo rutinario y muy asequible económicamente. En abril de 2008 se publicó el genoma individual de James Watson, secuenciado con las tecnologías más reciente. El precio de la secuenciación fue alrededor de un millón de dólares, 1/3000 el precio que costó el primer genoma. Se estima que para el año 2014 se podría conseguir la secuencia individual de un ser humano por unos 1000 dólares, lo que significa que pronto gran parte de la humanidad podrá disponer de la secuencia de su genoma y conocer las diferencias que lo hacen genéticamente único.
Bioinformática
Toda la avalancha de información genómica que generan las tecnologías de gran rendimiento sería imposible de manejar sin un desarrollo paralelo en recursos computacionales que permitan el almacenamiento, la gestión y al análisis de la información genómica. La bioinformática, el tratamiento informático de los datos biológicos, ha adquirido un protagonismo fundamental en la era genómica. Los millones de fragmentos de secuencias de ADN que producen las máquinas de secuenciación se ordenan y ensamblan con programas bioinformáticos sofisticados. Una vez se dispone de la secuencia ensamblada, llega el momento de dar sentido a la secuencia. Un conjunto de programas de anotación que buscan señales funcionales en el genoma son esenciales para inferir los genes que se encuentran en la secuencia y otro tipo de secuencias funcionales no génicas. Existen espléndidos lugares en línea donde se encuentran una gran diversidad de bases de datos, herramientas sofisticadas de análisis, e información tutorizada abundante para visualizar o analizar los genomas secuenciados.
Equipos multidisciplinares y complementarios
La genómica también ha cambiado la sociología de la investigación biológica. La magnitud y complejidad de los proyectos genómicos requieren de la colaboración en grandes redes científicas, con equipos multidisciplinares complementarios. Muchas de las publicaciones de genomas están firmadas por decenas, e incluso centenares, de científicos procedentes de diversos centros de investigación de países distintos, y esta tendencia no dejará de crecer. Los pequeños laboratorios continuarán existiendo, pero su peso relativo en la investigación disminuirá. La capacidad de colaboración e interacción con otros grupos de investigación, un modo de trabajar orientado hacia Internet y un dominio fluido del inglés forman parte de las competencias de un genético en la era genómica.
Un nuevo paradigma en la biología molecular
El genoma humano ha tenido una consecuencia todavía mucho más profunda en el modo de conceptualizar la biología molecular. Un nuevo paradigma, que ve a la biología como una ciencia informacional, es ahora dominante. El análisis de los sistemas biológicos se hace en términos de almacenamiento, transmisión y transformación de la información biológica que parte del genoma. El genoma es en esencia información digital que codifica los fenotipos y la cuestión fundamental de la biología es como se descodifica esta información para producir la forma y función de los organismos individuales. Desde el nuevo paradigma, los sistemas biológicos son redes complejas de miles de rutas, muchas de ellas conectadas entre sí, rutas biosintéticas, rutas de transducción de señales, rutas de regulación de la expresión de los genes. La integración, representación y modelado de las redes de interconversión de la información biológica requieren de análisis globales, sistémicos. La biología de sistemas o integrativa es uno de los campos en boga de esta nueva visión. El enfoque reduccionista que se ha aplicado a la biología durante todo el siglo XX es un ejemplo indiscutible de éxito científico, pues nos ha permitido descubrir los bloques de construcción de los organismos. Pero el siglo XXI es el de la reconstrucción de los organismos, el de un enfoque sintético, interdisciplinario, donde grandes grupos de investigación formados por genéticos, bioinformáticos, bioquímicos, físicos, matemáticos, médicos, informáticos,... trabajan conjuntamente para explicar las propiedades emergentes de los sistemas biológicos.
El genoma humano ha cambiado el modo de conceptualizar los procesos biológicos. Éstos se ven en términos de redes de interconversión de la información biológica que parte del genoma. La biología de sistemas trata de la integración, representación y modelado de la información biológica y requiere análisis globales, sistémicos.
Líneas de investigación actuales
Genómica comparada
La comparación de genomas tanto de especies próximas como lejanas es un enfoque muy útil para desvelar los procesos evolutivos que se dan en el genoma. También permiten conocer, a partir de las secuencias conservadas entre especies, que partes del genoma son funcionales. Por ejemplo, cuando se comparó el genoma humano con el del ratón se observó que un 5% del total de ambas secuencias estaba conservada, de lo que se dedujo que éste era el porcentaje mínimo de ADN funcional en ambos genomas. La comparación del genoma humano con el del chimpancé nos ha permitido cuantificar las diferencias que se han acumulado en ambos genomas desde que divergieron hace unos seis millones de años de un ancestro común.
Genómica funcional: las ómicas
La genómica funcional es el análisis global de la función, expresión e interacción de todos los genes de un organismo. Con el desarrollo de las tecnologías de gran rendimiento también es posible estudiar la expresión simultánea de los genes de un genoma, así como la interacción de sus proteínas. Siguiendo al término genoma (gen + oma, dónde oma se entiende como "todos los genes"), se han acuñado otros términos "ómicos" para describir el estudio de otros conjuntos de datos globales. El transcriptoma (las secuencias y patrones de expresión de todos los transcritos), el proteoma (las secuencias y patrones de expresión de todas las proteínas) y el interactoma (el conjunto completo de interacciones físicas entre proteínas, secuencias de DNA y de RNA) son algunos ejemplos.
Estudios de asociación genotipo-fenotipo
Para descubrir que variantes genéticas nos hacen diferentes en el seno de nuestra especie, es necesario estudiar los genomas de muchos individuos. El proyecto HapMap ha sido el siguiente hito tras la secuenciación del genoma. Su objetivo era caracterizar los patrones de variación genética en los distintos grupos étnicos de la especie humana, como un paso previo para poder realizar estudios a escala genómica que permitan asociar variantes genética a aspectos del fenotipo, especialmente las que confieren susceptibilidad a enfermedades. La aplicación conjunta de las tecnologías de gran rendimiento a la variación genética, de las herramientas bioinformática y de análisis estadísticos hacen posible la catalogación exhaustiva de las variantes genéticas que afectan al fenotipo humano, con las enormes implicaciones que se derivan para la prevención, el diagnóstico y el tratamiento personalizado de enfermedades.
El logro de la secuencia del genoma humano es el punto de partida a un nuevo conjunto revolucionario de enfoques que nos están conduciendo a una comprensión profunda y apasionante de la estructura, la función y la evolución de los genomas y de sus componentes.