El aprendizaje automático está ayudando a aprovechar el poder de las enzimas para una química más verde

Las máquinas moleculares de la naturaleza podrían acelerar el desarrollo de reemplazos bioquímicos amigables con el medio ambiente para los procesos industriales.

 

 Hacer que los productos que se consumen sean más sostenibles es algo que el mundo necesita desesperadamente. Y para la fabricación de productos químicos cotidianos, la solución podría estar en las enzimas -las pequeñas máquinas moleculares que aceleran las reacciones químicas que mantienen a casi todos los organismos vivos, además de catalizar muchos procesos de fabricación. Sin embargo, actualmente su adopción generalizada para uso industrial se ve obstaculizada por la dificultad de elegir la enzima adecuada para la reacción química correcta.

Para resolver este acertijo de combinación, se construyó un modelo de aprendizaje automático (Machine Learning) para ayudar a los científicos a predecir qué enzimas podrían ser reemplazos adecuados para una reacción determinada. Esto permitiría un acercamiento a procesos más sostenibles y seguros al aprovechar los catalizadores biológicos que han sido optimizados por el proceso evolutivo de la naturaleza en 3.500 millones de años.

Las enzimas son los principales aceleradores de la mayoría de los procesos en el cuerpo humano y desempeñan un papel fundamental en todo, desde la digestión hasta la descomposición de toxinas dañinas e incluso la replicación del ADN. La importancia de las enzimas va más allá de la bioquímica; también se utilizan para hacer más sostenibles los procesos químicos industriales al reducir su consumo energético o la cantidad de disolventes necesarios para su elaboración.

Al fabricar papel blanco para imprimir o usar en cuadernos, por ejemplo, la enzima xilanasa ayuda a reducir la cantidad de blanqueador a base de cloro, y al hornear, las enzimas proteasas ayudan a que las galletas se desmoronen al degradar el gluten en la harina de trigo. Pero todavía no hay muchas aplicaciones industriales en las que las enzimas se adopten ampliamente, porque elegir las correctas es una tarea abrumadora. A menudo requiere una gran cantidad de conocimientos específicos que ningún químico o equipo de químicos podría comprender por completo.

 Aquí es donde entra en juego el nuevo modelo de IA de IBM1, basado en datos para la planificación de síntesis biocatalizada. El modelo está entrenado con datos USPTO disponibles públicamente sobre biocatálisis enzimática que, en principio, elimina la necesidad de que un ser humano sea un experto en biocatálisis para seleccionar la enzima y el sustrato necesarios para obtener una sustancia química deseada. Al hacer esto, el modelo cierra una brecha de conocimiento que a menudo impide que se utilicen reacciones más sostenibles en la industria.

Al construir y entrenar el modelo de IBM, se aprovechó el aprendizaje de transferencia multitarea, mediante el cual el modelo aprende de una base de datos de reacciones biocatalizadas con un enfoque limitado y de una base de datos más grande que contiene todo tipo de reacciones químicas. La transferencia multitarea sería como aprender a tocar la guitarra y el bajo al mismo tiempo. Y en el contexto de la química, significa que se entrena el modelo simultáneamente en los conjuntos de datos generales y específicos de las reacciones enzimáticas, en lugar de secuencialmente.

Acelerar el descubrimiento de nuevos materiales está en el corazón de los esfuerzos de IBM para ayudar a inventar lo que sigue en ciencia e ingeniería. Es el tipo de trabajo que se está realizando con RoboRXN, una plataforma basada en la nube, impulsada por datos y potenciada por IA para la automatización de la síntesis química. Con el nuevo modelo de aprendizaje automático, se están ampliando las capacidades de RoboRXN para incluir una nueva herramienta que facilite el uso de enzimas para una química más respetuosa con el medio ambiente.

El modelo entrenado, así como el código, están disponibles públicamente para que cualquiera los use. IBM espera que los químicos los utilicen en sus proyectos de investigación.Se puede descargar el código de búsqueda de enzimas en GitHub o iniciar un proyecto con un modelo entrenado en RXN para Química.