El aprendizaje automático resuelve el problema de sufrir espectros de RMN de cristales orgánicos

La espectroscopia de resonancia magnética nuclear de estado sólido (RMN), una técnica que mide las frecuencias emitidas por los núcleos de ciertos átomos expuestos a ondas de radio en un campo magnético fuerte, se puede utilizar para determinar estructuras químicas y tridimensionales, así como la dinámica de moléculas y materiales.

Sin embargo, el paso inicial necesario en el análisis es la denominada asignación de desplazamiento químico. Esto implica asignar cada pico en el espectro de RMN a un átomo específico en la molécula o sustancia en cuestión. Esta puede ser una tarea particularmente compleja. La determinación de los cambios químicos de forma experimental puede ser un desafío y, en general, requiere experimentos de asociación multidimensionales que consumen mucho tiempo. La asignación por comparación con el análisis estadístico de bases de datos experimentales de desplazamiento químico sería una solución alternativa, pero no existe tal base de datos para sólidos moleculares.

Un equipo de investigadores que incluye a los profesores de EPFL Lyndon Emsley, presidente de Laboratorio de resonancia magnéticaPresidente Michel Serioti Laboratorio de modelado y ciencia computacional El estudiante de doctorado Manuel Cordova decidió abordar este problema desarrollando un método para asignar probabilísticamente los espectros de RMN de cristales orgánicos, directamente a partir de las estructuras químicas bidimensionales.

Comenzaron creando su propia base de datos de transformaciones químicas de sólidos orgánicos mediante la combinación de Cambridge Structural Database (CSD), una base de datos de más de 200.000 estructuras orgánicas 3D, con ShiftML, un algoritmo de aprendizaje automático que desarrollaron juntos anteriormente y que permite la predicción de cambios químicos directamente a partir de la estructura de los sólidos moleculares.

READ  Los ingenieros han creado un revestimiento simple que puede mejorar de manera impresionante la resolución del microscopio.

Descrito inicialmente en un artículo de Nature Communications en 2018, ShiftML utiliza cálculos DFT para el entrenamiento, pero luego puede hacer predicciones precisas sobre nuevas estructuras sin cálculos cuantitativos adicionales. Aunque se logra la precisión de DFT, el método puede calcular cambios químicos para estructuras que contienen ~ 100 átomos en ~ segundos, reduciendo el costo computacional en un factor de hasta 10,000 en comparación con los cálculos de desplazamiento químico actuales para DFT. La precisión del método no depende del tamaño de la estructura investigada y el tiempo de predicción es lineal en el número de átomos. Esto allana el camino para calcular los cambios químicos en situaciones en las que esto no hubiera sido posible antes.

En el artículo de Science Advances, utilizaron ShiftML para predecir cambios en más de 200.000 compuestos extraídos de CSD y luego correlacionaron las transformaciones obtenidas con las representaciones topológicas de los entornos moleculares. Esto implicó la creación de un gráfico que representa los enlaces covalentes entre los átomos de una molécula, aumentando el número de enlaces alejados de los átomos centrales. Luego recopilaron todos los ejemplos coincidentes del gráfico en la base de datos, lo que les permitió obtener distribuciones estadísticas de los cambios químicos para cada modelo. La representación es una simplificación de los enlaces covalentes alrededor de un átomo en una molécula y no contiene ninguna característica estructural 3D: esto les permitió obtener la asignación probabilística de los espectros de RMN de cristales orgánicos directamente de sus estructuras químicas 2D a través de un esquema de marginación que recoge las distribuciones de todos los átomos de la molécula.

READ  Se han descubierto cinco esqueletos gigantes de la edad de hielo en los Cotswolds

Después de crear la base de datos de cambios químicos, los científicos buscaron predecir asignaciones en un sistema modelo y aplicaron el enfoque a un grupo de moléculas orgánicas para las cuales la tarea de cambiar el carbono químico había sido determinada experimentalmente, al menos parcialmente: teofilina, timol, cocaína. , estricnina, AZD5718, lisinopril y ritonavir., y sal K de penicilina G. Las probabilidades de asignación obtenidas directamente de la representación bidimensional de las moléculas se ajustan a la tarea definida experimentalmente en la mayoría de los casos.

Finalmente, evaluaron el rendimiento del marco en un conjunto estándar de 100 estructuras cristalinas con entre 10 y 20 átomos de carbono diferentes. Utilizaron las transformaciones predichas por ShiftML para cada átomo como la tarea correcta y los excluyeron de las distribuciones estadísticas utilizadas para mapear las moléculas. La asignación correcta se encuentra entre las dos asignaciones más probables en más del 80% de los casos.

«Este método puede acelerar enormemente el estudio de materiales por RMN al simplificar uno de los primeros pasos esenciales de estos estudios», dijo Cordova.

/Liberación General. Este material de la (s) organización (es) original (es) puede ser de naturaleza puntual y está editado para mayor claridad, estilo y extensión. Las opiniones y opiniones expresadas son las del autor (es). Muéstralo en su totalidad Aquí.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.