El innovador mapa de Gnocchi revela secretos ocultos del genoma humano

En un estudio reciente publicado en naturalezaInvestigadores de Estados Unidos han ensamblado y procesado 76.156 genomas humanos para construir un mapa de restricciones genómicas llamado “restricción genómica no codificante para una variación suficiente de haploínas” (Gnocchi) para todo el genoma. Descubrieron que las regiones restringidas no codificantes del genoma eran ricas en elementos reguladores conocidos y variantes asociadas con rasgos y enfermedades humanos. El mapa podría resultar útil para mejorar nuestra comprensión de la variación genética funcional en el genoma humano.

Estancia: Mapa de restricciones de mutación genómica utilizando variación en 76.156 genomas humanos. Haber de imagen: Gio.tto/Shutterstock

fondo

Los avances en la secuenciación genómica humana brindan información sobre los patrones de variación en los genes, lo que permite la evaluación directa de la selección negativa en la variación sin sentido y la pérdida de función (LOF) a través del modelado de restricciones. Aquí, la restricción se define como la reducción de la varianza en un gen en relación con una expectativa basada en la mutabilidad del gen. Los esfuerzos anteriores se han centrado en codificar regiones que representan menos del 2% del genoma. Como resultado, el genoma no codificante a gran escala sigue siendo menos explorado a pesar de su reconocida importancia en enfermedades humanas complejas. La aplicación del modelo de restricción genética a regiones no codificantes enfrenta desafíos debido a los datos limitados del genoma completo, la falta de modelos específicos de nucleótidos, la sobrerrepresentación de regiones codificantes en los análisis de mutaciones y la tasa de mutación compleja y heterogénea que está influenciada tanto por factores locales como genómicos. amplias poblaciones. Características.

Los métodos actuales para evaluar las limitaciones de las regiones no codificantes incluyen modelos mutacionales dependientes del contexto, clasificadores de aprendizaje automático y puntuaciones de conservación filogenética. Sin embargo, tiene limitaciones, como ignorar las características genómicas regionales, depender de mutaciones bien caracterizadas y tener poco poder para detectar regiones recientemente seleccionadas con efectos funcionales sobre enfermedades o rasgos humanos específicos. Para abordar esta necesidad, los investigadores de este estudio desarrollaron un mapa de restricción de todo el genoma para identificar elementos genómicos funcionales (particularmente en el espacio no codificante) que probablemente acumulen variación y tengan posibles implicaciones clínicas. El mapa también proporciona información sobre el impacto de la selección natural en la diversidad genética humana.

Sobre el estudio

El estudio actual reunió y reprocesó 153.030 genomas completos de la base de datos de ensamblaje del genoma (gnomAD) y los alineó con la estructura de referencia del genoma humano GRCh38. Al final, se retuvieron 76.156 muestras de alta calidad de individuos sanos, no relacionados y de diversos orígenes. El estudio identificó y utilizó 390.393.900 variantes de nucleótido único de alta calidad y baja frecuencia para construir un mapa de restricción de todo el genoma. El genoma se dividió en ventanas continuas de 1 kb que no se superponen. La restricción se midió para cada ventana comparando la varianza observada y esperada. Se utilizó un modelo mutacional refinado, que combina el contexto de la secuencia de trinucleótidos, las características genómicas regionales y la metilación a nivel de bases para predecir los niveles de variación esperados bajo neutralidad. La desviación entre la varianza esperada y observada se midió utilizando la “puntuación de ñoquis”. Para su validación se determinó la relación entre la medida Gnocchi y diversas anotaciones de secuencias funcionales no codificantes. La capacidad de la puntuación Gnocchi para priorizar variantes no codificantes se comparó con otras métricas basadas en genética de poblaciones, incluidas Orion, CDTS (puntuación de tolerancia dependiente del contexto), gwRVIS (puntuación de intolerancia a la variación residual de todo el genoma) y rango de agotamiento. midiendo el área bajo la curva estadística. Además, se analizaron las limitaciones de los potenciadores asociados con genes específicos.

READ  La iluminación interior genera energía para sensores y dispositivos recargables

Resultados y discusión

Se encontró que la puntuación de Gnocchi era cercana a cero para las regiones no codificantes y significativamente mayor para las ventanas que contienen secuencias codificantes. Alrededor del 3,12% y el 0,05% de las ventanas no codificadas mostraron una restricción tan fuerte como 50y y 90y Porcentaje de regiones exteriores, respectivamente. Se encontró una correlación positiva significativa entre las anotaciones no codificantes restringidas y funcionales, lo que demuestra la utilidad de la puntuación Gnocchi para caracterizar regiones no codificantes y proporcionar información adicional. Se ha demostrado que la puntuación Gnocchi funciona bien frente a otras métricas no codificantes, identificando eficazmente variantes funcionales en el genoma no codificante. Sin embargo, los investigadores sugieren que una combinación de métricas sería ideal para priorizar la diversidad funcional. También se ha descubierto que la escala Gnocchi es útil para priorizar las variantes del número de copias (CNV), lo que ayuda a interpretar factores de riesgo no codificantes en estudios que relacionan las CNV con enfermedades. Según el estudio, se descubrió que los potenciadores asociados con genes restringidos eran significativamente más restrictivos que aquellos asociados con genes menos restrictivos. Además, el estudio subraya el valor de la restricción de no codificación como medida complementaria de la restricción genética para identificar genes funcionalmente importantes.

Aunque el impacto biológico de las mutaciones en los potenciadores no se comprende bien, los investigadores sugieren que existe la posibilidad de que un modelo ampliado proporcione información biológicamente informada sobre la variación no codificante y los mecanismos moleculares de selección. Si bien el estudio utiliza uno de los conjuntos de datos más completos sobre genomas humanos para analizar restricciones no codificantes, el poder y la resolución del enfoque pueden mejorar significativamente a medida que aumenta el tamaño de la muestra.

READ  Niños curiosos: ¿Por qué vemos "el cielo" durante el día, mientras que vemos la galaxia de noche?

Conclusión

En resumen, el presente estudio destaca la importancia del mapeo de restricción de todo el genoma en el análisis de regiones no codificantes y genes codificantes de proteínas. Esto representa un progreso crucial hacia el desarrollo de una lista completa de elementos funcionales en el genoma humano, lo que impulsa más investigaciones en esta área.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *