El aprendizaje automático estadístico puede encontrar factores desconocidos detrás de las enfermedades

Un nuevo método ahora puede encontrar factores subyacentes a enfermedades previamente desconocidos mediante el uso de aprendizaje automático estadístico para clasificar montañas de datos biológicos complejos.

Este método «pionero», llamado SLIDE, integra con éxito múltiples conjuntos de datos biológicos complejos y extrae factores únicos (en inglés, lo que hace que los resultados sean fáciles de entender) que explican directa o indirectamente los datos.

Esto puede cambiar la forma en que pensamos acerca de los datos multiómicos: conjuntos de datos grandes y diversos que pueden incluir información detallada sobre la genética, el metabolismo y las funciones de una célula, tejido o individuo, según investigadores de la Universidad de Cornell y un doctorado de Cornell. .D. Ahora en la Universidad de Pittsburgh.

«Sus estudios»Diapositiva: Descubra y explore la interacción de importantes factores subyacentes en todos los dominios biológicos”, se publicó el 19 de febrero en la revista Nature Methods.

«Me gusta porque es explicable», dijo el coautor. Florentina BoniaAnne S., profesora de estadística y ciencia de datos en Cornell College. Potencia la Computación y las Ciencias de la Información. «Básicamente, podemos encontrar mecanismos ocultos que se pueden explicar a través de aportes biológicos mensurables».

El estudio se basa en el trabajo teórico realizado por coautores, entre ellos Punia; Martín Wikamp, Profesor de Estadística y Ciencia de Datos en Cornell CIS y Matemáticas en la Facultad de Artes y Ciencias; y Shen Ping, Ph.D. '21, ex estudiante de doctorado en estadística en Cornell y ahora en la Universidad de Toronto.

SLIDE ofrece tanto confirmación como descubrimiento, porque puede corroborar hallazgos anteriores y señalar mecanismos desconocidos, dijo Punia.

READ  Los médicos de las zonas rurales de Australia están perdiendo la vacuna contra el coronavirus

Para desarrollar esta aplicación, teóricos de la Universidad de Cornell colaboraron con el Dr. Jishnu Das. '16, profesor asistente de inmunología en la Universidad de Pittsburgh, es un inmunólogo de sistemas que estudió biología computacional en la Universidad de Cornell, donde tomó clases de estadística con Bonya.

SLIDE representa un avance con respecto a los métodos anteriores, que solo pueden tomar perfiles de datos multiómicos de muestras y predecir si las muestras provienen de organismos sanos o enfermos. «Esto es sólo una expectativa», dijo Das. “Este es el 'qué', no el 'cómo' ni el 'por qué'. Como biólogo, me importa profundamente el cómo y el por qué.

Los investigadores demostraron la eficacia de SLIDE utilizando datos de 24 pacientes con esclerodermia sistémica, un trastorno autoinmune que provoca engrosamiento de la piel y también puede debilitar los órganos internos. Utilizando datos de biopsias de piel que mostraban qué genes estaban activados en células individuales, los investigadores pudieron predecir la gravedad de la enfermedad para cada paciente tan bien o mejor que los métodos modernos.

También identificaron nueve factores ocultos que subyacen a la gravedad de la afección. Algunos de estos factores están bien establecidos, mientras que otros son nuevos, como el papel previamente desconocido de los queratinocitos, la célula principal de la capa externa de la piel. Ya se están realizando experimentos de laboratorio adicionales para confirmar que los agentes identificados por SLIDE realmente están causando los síntomas de la enfermedad.

El artículo describe cómo el laboratorio de Das también utilizó un chip SLIDE para reproducir las ubicaciones de diferentes tipos de células inmunitarias en un ganglio linfático en un modelo de asma en ratones. Asimismo, en un modelo de ratón con diabetes tipo 1, SLIDE identificó con éxito factores que impulsan la proliferación de células T CD4+, que atacan las células del páncreas que producen insulina, lo que provoca la enfermedad.

READ  Una verdadera jeringa en el brazo para la anafilaxia.

«Realmente creemos que será una tecnología transformadora en todos los contextos de enfermedades, desde la observación de la gravedad de la enfermedad hasta las características celulares, los mecanismos de patogénesis de la enfermedad y los tipos de células específicas involucradas en el impulso de estos procesos», dijo Das.

Punia describe esta colaboración entre teóricos e investigadores aplicados como “una sinergia que ha dado sus frutos”, señalando que las garantías estadísticas de que los factores ocultos son únicos e identificables son lo que le da al método su poder.

«Cuanta más gente teórica se involucre en aplicaciones del mundo real, mejor para todos nosotros», dijo.

Otros contribuyentes a este artículo incluyen a los coautores Javad Rahimkulu y Hanxi Xiao de la Universidad de Pittsburgh.

Patricia Waldron es redactora de Cornell Anne S. Potencia la Computación y las Ciencias de la Información.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *