La inteligencia artificial arrasa en
uno de los problemas más importantes
de la biología
====================================
Por: Nuño Domínguez

Una filial de Google consigue un
avance sin precedentes en la
predicción de la forma de las
proteínas

Un sistema de inteligencia artificial
desarrollado por Google ha resuelto
buena parte de uno de los problemas
más importantes de la biología. Las
redes neuronales desarrolladas por la
empresa Deepmind, propiedad del
gigante tecnológico, han demostrado
en una competición internacional que
su capacidad de cálculo y predicción
son muy superiores a la de cualquier
humano e incluso a la de cualquier
otro sistema de inteligencia
artificial creado por humanos.

“Es una revolución”, reconoce Alfonso
Valencia, uno de los mayores expertos
en biocomputación de España y miembro
del jurado técnico del concurso CASP,
siglas inglesas de técnicas para la
predicción de estructuras de las
proteínas. “Lo más importante que nos
deja este avance es saber que este
problema [que nadie había resuelto
desde que se formuló hace 50 años]
tiene solución, que es posible
resolverlo”.

El problema del plegado de las
proteínas está considerado como el
segundo código secreto de la vida.
Deepmind había ya ganado a los
humanos en ajedrez y el
complicadísimo Go, por ejemplo, pero
este siempre ha sido su problema
prioritario a resolver.

Para comprender su importancia hay
que empezar por el primer código de
la vida, el genoma, que contiene toda
la información para formar cualquier
ser vivo. Una persona es una
secuencia genómica de 3.000 millones
de letras, cada una en su posición
correcta. En esas letras están todas
las instrucciones para fabricar
proteínas, que son las verdaderas
obreras de la vida encargadas de que
alguien pueda respirar, moverse,
pensar, vivir. La estructura básica
del código genético es bidimensional,
pero las proteínas que forma son
tridimensionales, como la diferencia
entre el plano de una casa y la casa
de verdad.

Uno de los mayores hitos científicos
de esta pandemia ha sido conocer la
estructura de la proteína del nuevo
coronavirus que encaja exactamente en
otra proteína de las células humanas
para adueñarse de ellas. Las
proteínas mal construidas, mal
plegadas sobre sí mismas, son la
causa de enfermedades tan terribles
como el alzhéimer, el parkinson y
muchas otras.

En 1972, el Nobel de Química
Christian Anfinsen postuló que la
secuencia de aminoácidos de una
proteína [su plano] debía predecir la
forma que tendría. Pero averiguar
todas las configuraciones posibles de
una sola proteína puede llevar más de
13.700 millones de años: la edad del
universo.

En el concurso CASP Deepmind competía
con otros 100 equipos en ser el mejor
en predecir la forma de 100 proteínas
basándose en su secuencia de
aminoácidos. La inteligencia
artificial de Google ha arrasado. Su
sistema, Alphafold, ha predicho
correctamente la estructura de dos
tercios de todas las proteínas con
una resolución equivalente a la de
los métodos convencionales basados en
cristalografía y microscopía, que
requieren máquinas de unos ocho
millones de euros y en ocasiones años
o décadas de trabajo.

Es un resultado nunca alcanzado antes
por ningún equipo humano ni por
ninguna otra inteligencia artificial.
El margen de error de las
predicciones de Google es equivalente
al diámetro de un solo átomo, explica
Deepmind, que ya ganó la anterior
edición en 2018.

“Su puntuación es muy, muy superior a
la de cualquier otro equipo del
certamen”, explica Tim Hubbard,
bioquímico del King’s College de
Londres y organizador de este
concurso académico durante 10 años.
“Esta contribución es fundamental
porque nos ayuda a resolver un
problema que determina no solo la
biología humana, sino la del resto de
seres vivos del planeta”, resalta
Hubbard.

Alphafold se basa en algoritmos que
aprenden por sí mismos y ven patrones
no visibles para humanos, pues están
escondidos en inabarcables bases de
datos con miles de proteínas
compuestas por millones de
fragmentos. “Este tipo de sistemas ya
había ganado a los humanos en
videojuegos porque encontraba errores
en la programación que permitían por
ejemplo atravesar paredes”, explica
Valencia. “Gana a los humanos con
formas de pensar no humanas, por eso
aunque este sistema pudiese hablar y
nos contara cómo lo ha hecho, no
entenderíamos la física que hay
detrás de una proteína plegándose.
Solo conocemos el resultado. Google
no proporciona el software y esta es
la parte frustrante del logro porque
no va a beneficiar directamente a la
ciencia”, detalla.

“No creemos que Deepmind vaya a poner
Alphafold al servicio de la comunidad
científica, pues no lo hizo después
de la primera vez que ganó el
certamen”. No obstante habrá una
repercusión “indirecta”, añade.
Deepmind describirá todos sus métodos
en un estudio completo revisado por
expertos independientes y esto podrá
ayudar a otros equipos a desarrollar
sistemas de inteligencia artificial
similares.

“Es un paso muy importante, se
llevaba muchos años intentando
descifrar ese código oculto de la
vida”, resume Fernando Corrales,
investigador del Centro Nacional de
Biotecnología del CSIC. En la
naturaleza puede haber decenas de
miles de proteínas diferentes y cada
una es un mundo completamente
diferente del otro. “Hay ocasiones en
las que se puede conocer la
estructura completa en apenas un mes,
y otras en las que es complejísimo y
puede llevar años o décadas”, señala
Corrales. Para este científico la
inteligencia artificial de Google no
dejará sin trabajo a los
cristalógrafos y expertos en
microscopía en el corto plazo, pues
aún son necesarias para corroborar
las predicciones de la inteligencia
artificial. Además, el problema del
plegamiento de proteínas no se ha
resuelto del todo, pues quedan
niveles adicionales de complejidad.
Las proteínas suelen funcionar en
grupos formando complejos y entender
su forma y movimiento es un problema
que por ahora sigue sin resolver.

Deepmind explica a este diario que
publicará todos los detalles sobre su
sistema en una revista científica
próximamente. Sus responsables
explicarán su trabajo esta tarde en
una conferencia online. Un portavoz
de la empresa ha señalado que aún no
han decidido si harán su sistema
accesible a la comunidad científica.
“Aunque de alguna manera hemos
resuelto el problema de plegado de
las proteínas, hay muchos otros que
nos gustaría afrontar. Somos
optimistas en que este sistema puede
ayudarnos a comprender enfermedades y
a descubrir nuevos fármacos”, señala.

## Vía

https://elpais.com/ciencia/2020-12-02/la-inteligencia-artificial-arrasa-en-uno-de-los-problemas-mas-importantes-de-la-biologia.html