Químicamente, las proteínas son solo una larga cadena de aminoácidos. Sus asombrosas propiedades se muestran porque esta cadena se puede doblar en una forma 3D compleja. Entonces, comprender las reglas que gobiernan este plegamiento no solo nos da una idea de los usos de las proteínas en la vida, sino que también puede ayudarnos a diseñar nuevas proteínas con nuevas capacidades químicas.
ha pasado Progreso significativo Sobre el La primera mitad de ese problema Recientemente, los investigadores ajustaron los sistemas de IA para clasificar las relaciones evolutivas entre proteínas y vincular características comunes con estructuras. Sin embargo, hasta ahora estos algoritmos no son útiles para diseñar nuevas proteínas desde cero. Pero eso podría cambiar gracias a los métodos descritos en un artículo publicado el miércoles.
En él, un gran equipo de investigadores describe lo que la proteína llama «alucinaciones». Este es el producto de un proceso similar a un juego más caliente / más frío con un algoritmo, comenzando con una secuencia aleatoria de aminoácidos, haciendo un cambio y preguntando: «¿Parece una proteína estructurada?» Se han probado varios resultados y, de hecho, se pliegan como se esperaba.
Alucinación de IA
La extraña terminología aquí no se puede culpar a los autores del nuevo artículo. En cambio, se ha aplicado el término «alucinaciones». Trabajo realizado por el equipo de inteligencia artificial de Google. Este trabajo implicó comenzar al azar a partir de un píxel y preguntar a una red neuronal entrenada para reconocer una fruta: «¿Cuánto se parece a un plátano?» Después de hacer algunos ajustes al azar, se volvió a formular la pregunta; Se retuvo cualquier cambio que aumentara las propiedades parecidas a las del plátano de la imagen y se repitió el proceso.
El resultado final obviamente tiene aspectos de plátano, pero se parece más al cubismo y al impresionismo que ambos plátanos tenían antes de ejecutar algunos filtros aleatorios de Photoshop. Si bien el término no se usó en una publicación de blog de Google, otros llamaron a las imágenes una «alucinación».
Los investigadores pensaron que si esto funcionaba con sistemas de inteligencia artificial que se ocupan del reconocimiento de imágenes, también podría funcionar con sistemas de inteligencia artificial que sugieren estructuras 3D para proteínas.
Sin embargo, aquellos que presten mucha atención aquí pueden notar un problema. Los algoritmos para la biología no producen una clasificación de si algo se parece a una estructura; En cambio, simplemente asumen que hay una estructura y tratan de sugerir cuál es. Por lo tanto, no fueron creados por naturaleza para hacer el tipo de evaluación más caliente / más fría necesaria para crear una alucinación.
Sin embargo, el equipo de investigación ha encontrado una forma de evitar esto. Las proteínas no estructuradas tienden a extenderse en el espacio, con solo unos pocos aminoácidos vecinos interactuando entre sí. Por el contrario, las proteínas altamente organizadas tienden a ser compactas y plegables, por lo que los aminoácidos en diferentes partes de la cadena pueden interactuar entre sí. El algoritmo que estaban usando para predecir la estructura, trRosetta, produce sus predicciones como la posición relativa de cada aminoácido en un espacio 3D. Por lo tanto, utilizando su medida de prevalencia, los autores pudieron dar una especie de respuesta a la pregunta «¿Qué tan organizada está esta figura?»
Comenzando con aleatorio
Para iniciar la alucinación esquelética, los investigadores generaron varias proteínas de 100 aminoácidos aleatorios y las introdujeron en el programa trRosetta. Como era de esperar, inicialmente todas las proteínas se regularon negativamente. Luego, para cada una de las 100 secuencias, se seleccionó al azar un aminoácido y se cambió a un aminoácido diferente que también se seleccionó al azar. Luego trRosetta realizó un nuevo análisis y se compararon los resultados; Se ha mantenido cualquier cambio que haga que las cosas parezcan más ordenadas.
En unas 20.000 iteraciones de este proceso, la coherencia de la disposición de los aminoácidos en estas alucinaciones era de naturaleza similar a la de las proteínas normales. Pero, lo que es más importante, las secuencias de aminoácidos no eran similares a las de las proteínas conocidas. Las estructuras en sí mismas tampoco hicieron eso. En las proteínas utilizadas por la vida, a menudo hay bucles de aminoácidos mal regulados que realizan funciones clave. Pero no se seleccionó la función alucinógena. Fueron elegidos por su compacidad. Por tanto, este tipo de episodio prolongado no se encuentra en las alucinaciones.
Hay varias razones para ser escéptico de que las cadenas reales de aminoácidos formen estas estructuras en el mundo real. trRosetta no es el último y mejor software de predicción de arquitectura que ha acaparado todos los titulares. trRosetta está capacitado para descubrir la estructura en parte mediante la evaluación de las relaciones evolutivas. Todas estas proteínas son completamente nuevas y no tienen parientes evolutivos. El proceso solo funcionaría si la red neuronal utilizada en trRosetta dedujera los principios de la estructura de las proteínas a partir de esas relaciones evolutivas.
La única forma de saber si funciona o no es fabricar las proteínas reales y ver cómo se ven. Por lo tanto, el equipo de investigación reunió los genes que codifican 129 proteínas alucinógenas.
«Solucionador de problemas. Gurú de los zombis. Entusiasta de Internet. Defensor de los viajes sin disculpas. Organizador. Lector. Aficionado al alcohol».