Con este androgenado título doy comienzo a una serie de post sobre proyectos científicos que cuando se comenzaron, bien merecían a la imaginación, un conjunto de tíos embatados diciendo, ¡No hay huevos a…! Este es el caso de los experimentos CASP.
Los CASP Experiments (Critical Assessment of techniques for protein Structure Prediction), son una serie de experimentos que en la actualidad se encuentran en la 10 edición y cuyo próximo experimento finalizará en 2012.
Bueno, de qué va esto. Como la mayoría ya saben, (y sino lo saben que se lean mi entrada sobre las proteínas intrínsecamente desordenadas) para determinar la estructura de una proteína hay que llevar a cabo una serie de pasos de extracción, purificación, cristalización, bombardeo por rayos X o RMN, cálculos matemáticos, y reconstrucción en 3D con programas de ordenador, vamos, una panzá de reír de trabajo por hacer. Y todo esto en el caso de que se pueda llegar a hacer al final, porque a veces ni se puede y los grupos pasan años y años buscando la forma. Por todo esto, no es de extrañar que los Ingenieros de proteínas se planteasen desde muy pronto la posibilidad de predecir la estructura de las proteínas basándose solamente en la secuencia de la misma.
Teóricamente, la secuencia determina la estructura, y la estructura la función, o viceversa, una función se lleva a cabo por una estructura, la cual solo se puede formar con un número finito de secuencias. Pero claro, como siempre digo, cuando uno trabaja con proteínas no gana para sustos y de repente aparecen cosas tan raras como las Intrinsically disordered Proteíns y cosas así. Además, en muchas ocasiones, la función la lleva a cabo los dímeros, trímeros, tretrámeros y pentámeros (en la mayoría de los casos) y no las subunidades discretas que es lo que podemos teóricamente predecir.
Además, hay un anhelo y/o meta en todo esto de la ingeniería de proteínas. Hacer, diseñar, construir proteínas de diseño, que no existen en la naturaleza, que lleven a cabo funciones muy concretas. Es decir, que seamos capaces de escribir una secuencia, en lápiz y papel como quien dice, y que esa secuencia tenga una estructura predecible, y que la estructura o folding real sea la predicha para esa función. ¡Esto ya sería la repera vamos! Que me hace falta una proteína que destoxifique metales pesados en un organismo…pues le meto la secuencia que da lugar a la estructura, y listo. Que requiero diseñar una proteína que se vaya a las células cancerosas y les de una señal de Apoptósis…pues ahí la lleva. Miedo me da imaginar las posibilidades de esto. Pero hasta que no se pueda o se sepa hacer, hay mucho que estudiar. Y CASP persigue este conocimiento.
El procedimiento sería el siguiente. Un grupo de investigación, que está cristalizando o ha cristalizado una proteína, se le pide que libere la secuencia, y que estime una fecha para la publicación del trabajo de cristalización. Con esto se consigue que, a partir de la secuencia, se haga una proposición de estructuras posibles, teóricas y predichas por diferentes métodos. Para luego, con la estructura real conseguida con x-ray o RMN se compare y se anote la fiabilidad de los métodos de predicción.
La secuencia del experimento, que viene a durar unos dos años, es la siguiente:
- Cristalógrafos y espectroscopistas de RMN que están resolviendo la estructura de una proteína o casi la tienen resuelta, se les pide que liberen la secuencia de dicha estructura y que digan una fecha tentativa en la que publicarán el trabajo con la estructura real.
- Investigadores de todo el mundo que trabajan en predicción de estructuras con diferentes métodos, suben a la base de datos de CASP sus estructuras predichas, antes de que se libere el trabajo real de caracterización de la estructura.
- A la vez, la organización de CASP hace sus propias predicciones con programas de predicción que se pueden encontrar en la red, y hacen sus predicciones sin la intervención de la mano humana.
- Cuando la estructura experimental se ha publicado, una serie de asesores expertos de todo el mundo (sin saber quién ha hecho la predicción), comparan los modelos predichos con el real y le dan un valor al modelo.
- Los resultados de los experimentos y las conclusiones se ponen en común en una reunión y se publican en un número especial de la revista “Proteíns: Structure, Function and Bioinformatics”
Con todo esto, la organización de CASP, da una puntuación a los métodos y los algoritmos de cálculo de estructuras. Y creedme, que es muy importante, porque si vas a hacer una predicción de estructura, yo me fiaría más de los métodos que más alta puntuación han obtenido en los experimentos CASP.
Bueno, como cabía de esperar, esto no se hace con 2 o 3 proteínas. El experimento CASP1, que se hizo en 1994, contó con la colaboración de 35 grupos de investigación de todo el mundo, que aportaron 100 modelos para las 33 proteínas que se propusieron.
El pasado año, acabó la edición CASP9, y han participado 248 grupos, que han aportado 31.032 modelos para las cerca de 130 proteínas propuestas. ¡¡¡¡CASI NÁ!!!!
La cantidad de modelos propuestos para las proteínas que se dan…nos hacen darnos cuenta en seguida de que el problema está muy lejos de ser resuelto.
Curiosead un poco en la página www.predictioncenter.org
Bueno pues encima, y como no podía ser de otra forma, las proteínas nos vuelven a asustar y sorprender.
Existe un modelo de predicción de estructuras que se basa en la homología de las secuencias con lo anteriormente conocido, es decir, si mi proteínas se parece en secuencia en un 80% a otra secuencia de una proteína de la que sí se conoce bien la estructura, lo más probable es que tengan estructuras similares. Pues bien, este es el mejor método de predicción siempre que haya estructuras de proteínas que se parezcan mucho a la tuya. Es más, yo lo primero que haría es ver si mi proteína se parece mucho a otra de la que ya se sabe la estructura, yo pasaría un poco del resto de programas. PERO CUIDADO. Existe lo que se denomina el Desafío de Paracelsus.
Se han visto casos de proteínas que aún siendo similares en más del 70% (vamos que son primas hermanas) la estructura es radicalmente distinta. Es el caso de la proteínas G de Streptococcus. En esta proteína, 49 de los 56 aminoácidos son los mismos y en el mismo orden, y sin embargo, las estructuras que dan, son radicalmente diferentes, una de ellas da una estructura de todo Alpha (3 alpha) y se une a HSA y la otra da una estructura de alpha mas beta (4 beta + alpha) y se une a IgG.
Folding de las dos proteínas G de Streptococcus
Es la diferencia de un solo aminoácido la que hace que las estructuras sean radicalmente diferentes. Si cambiásemos cualquier otro aminoácido, la estructura no cambiaría tanto.
Sustitución del aminoácido 45 que determina la estructura radicalmente diferente de las 2 proteínas G de Streptococcus
Bueno, espero haber dado una idea de la dificultad de predecir la estructura de una proteína y del currazo que se esta dando la gente para mejorar las predicciones. Los experimentos CASP sin duda, son ejemplos de mega-experimentos que comenzaron en algún momento de los años 90 con un grupo de embatados que dijeron ¡NO HAY HUEVOS A…!
Espero vuestros comentarios. Un saludo
ATG
ResponderEliminarLa iniciativa de CASP es realmente interesante, debería incentivarse en más campos ;P
Por otra parte yo sinceramente espero que las proteínas que siguen el Desafío de Paracelso sean las excepciones, que sobre ese aminoácido de la proteína G esté actuando algo muy concreto que sea el responsable del cambio te topología (y que no se deba a la secuencia). El mismo proceso de la evolución es el que justifica que secuencias parecidas den estructuras similares...
Supongo que los que se dedican a estructura de proteínas también lo esperan jaja.
TAA
ATG
ResponderEliminarEstimadísimo Anónimo, llevas toda la razón. Deberían de ponerse en práctica iniciativas como CASP para muchos campos que son controvertidos, pero ahora imagínate que si ya en hacer una publicación, mandarla a los referis, correcciones, y tal, se te va tiempo, al pobre becario que lo pongan a esperar un CASP para publicar su trabajo... jejeje
Yo opino igual que tu, que los desafíos de Paracelso son pocos y muy raro, por eso los traigo a colación, pero no debemos de olvidarnos de ellos. Al menos hasta que no tengamos algoritmos que nos predigan Paracelsos y otras tantas cosas chungo-raras.
En cuanto a la evolución, es muy puñetera, y como para muestra un botón, te invito a alinear las Superóxido Dismutasa de varios organismo. En concreto cógete algunas de Trypanosoma y Leishmania. No tienen nada que ver en estructura y sin embargo llevan a cabo la misma función. En fin, mientras haya retos, habrá ciencia. Y espero que eso sea para siempre.
TAA
Bastante curiosa la entrada, no tenía conocimiento de esta iniciativa, y sus posibilidades finales son la hostia!
ResponderEliminar(poco a poco voy haciendo los deberes como ves)
Me alegro de que te guste Jukini. La verdad que es una iniciativa curiosa y muy a imitar por otros aspectos de la ciencia.
ResponderEliminarSi aún vas por aquí aún te queda mucho trabajo por hacer jeje. Un abrazo.