Predicción de la estructura de ARN 3D utilizando un modelo centrado en hélice de grano grueso
Enviado por Helena • 21 de Diciembre de 2018 • 8.117 Palabras (33 Páginas) • 414 Visitas
...
El resto del artículo describe primero la conversión de una estructura secundaria en un gráfico que representa la conectividad entre los diferentes elementos de la estructura secundaria. Esto es seguido por una descripción de la representación de grano grueso de una hélice y los métodos usados para ajustar una hélice a una estructura conocida de todo el átomo. Luego cambiamos el enfoque a los parámetros utilizados para ensamblar estructuras terciarias y la función de energía utilizada para dirigir el muestreo hacia estructuras realistas. Demostramos la eficacia de este enfoque en la generación de conjuntos estructurales que se ajustan a las distribuciones de destino y terminar con una breve comparación con otros métodos de predicción de la estructura. El software que implementa este enfoque se titula Ernwin, está licenciado bajo la licencia GPL-V3 y está disponible gratuitamente en Github (http://github.com/pkerpedjiev/ernwin ).
Ir:
MATERIALES Y MÉTODOS
Elementos de estructura secundaria y definición de gráfico
La estructura secundaria de una molécula de ARN puede representarse como una colección de elementos que comparten características similares en términos de cómo vinculan las hélices canónicas dentro de la estructura. Los elementos estructurales individuales y su conectividad se representan en la Figura 1 . La representación gráfica ( Fig. 1 B), que se utiliza para dirigir la construcción del modelo 3D, es casi idéntica al gráfico esquemático descrito por Lamiable et al. (2013) , y será referido como tal en el resto de este artículo. Las siguientes definiciones asumen la falta de pseudoknots en la estructura secundaria.
[pic 1]
FIGURA 1.
La representación de grano grueso de la estructura 2D de una molécula de ARN. ( A ) Las regiones apareadas se muestran como rectángulos grises. Los arcos muestran la trayectoria de la hebra en conectar las regiones emparejadas. Las etiquetas en negro son nombres dados para distinguir ...
Los "tallos" son regiones helicoidales canónicas de doble cadena. Son identificados por los nucleótidos en cada "esquina", es decir, los nucleótidos en los extremos 5 'y 3' de cada una de las hebras (véase la figura 1). Las esquinas están numeradas en orden creciente de 5 'a 3' de modo que c 1 ( s ) c 2 ( s ) c 3 ( s ) c 4( s ) donde c n ( s ) es el índice del nucleótido en la esquina n del vástago s . Los tallos pueden estar conectados entre sí a través de bucles interiores o segmentos de multiloop.
La "5 'región no emparejada" es el conjunto de nucleótidos no emparejados en el extremo 5' de la molécula. Se define por el primer y último nucleótidos no apareados antes del primer tallo. Esta sección siempre está conectada al primer vástago. Si no hay regiones emparejadas, entonces toda la molécula será una única región 5 'no emparejada.
Los "bucles interiores" son regiones de doble cadena que enlazan exactamente dos tallos y no contienen pares de bases canónicas, aunque pueden ser ricos en pares de bases no canónicos ( Leontis et al., 2006 ). Estas regiones siempre se conectan esquinas 2 y 3 de un tallo ( s j ) para esquinas 1 y 4 de la siguiente vástago ( s k ), donde el término “próximo tallo” implica que c 1 ( s j ) c 1 ( s k ). Puesto que no se permiten pseudoknots en nuestra representación tenemos c 2 ( s j ) c 1 ( s k ) c 4 ( s k ) c 3 ( s j ). Los bucles interiores son definidos por los nucleótidos c 2 ( s j ) + 1, c 1 ( s k ) - 1, c 4 ( s k ) + 1 y c 3 ( s j ) - 1 para s j y s k siguientes uno al otro. Si una hebra de un bucle interior no tiene bases desparejadas, entonces el bucle interior está definido solamente por los nucleótidos no apareados en la otra hebra. El bucle interiori 1 en la figura 1 conecta los dos tallos s 3 y s 4 .
"Segmentos de Multiloop" son regiones unpaired monocatenarios que conectan dos tallos que no son separados por un lazo interior. Pueden conectar dos tallos s j y s k donde s j s k de tres formas diferentes: c 2 ( s j ) → c 1 ( s k ), c 4 ( s j ) → c 1 ( s k ) y c 3 (s j ) → c 4 ( sk ). En laFigura 1 hay tres segmentos multiloop: m 1 , m 2 y m 3 .
La "3 'región no emparejada" denota los nucleótidos no emparejados en el extremo 3' de la molécula. Esta región sólo se conecta con el último tallo en la estructura ( s 1 ) y se define por el nucleótido c 4 ( s 1 ) + 1 hasta el final 3 'nucleótido.
Creación del gráfico de la estructura secundaria
El gráfico de la estructura secundaria se crea a partir de las predicciones de la estructura secundaria del ARN. Actualmente, utilizamos RNAfold del paquete ViennaRNA v2 ( Lorenz et al., 2011 ). El gráfico de grano grueso puede crearse trivialmente a partir de cualquier representación estructural secundaria o algoritmo de predicción (es decir, plegado de energía libre mínimo, estructuras centróides, métodos no físicos) que no contiene pseudoknots. El enhebrar un modelo de grano grueso sobre una estructura 3D conocida requiere la extracción de la estructura secundaria, para lo cual utilizamos la anotación producida por MC-Annotate ( Gendron et al., 2001 ), eliminando los pseudoknots (método de eliminación de conflictos) ( Smit et al 2008), creando el gráfico de la estructura secundaria y luego adaptando las hélices al modelo de todos los átomos para obtener las coordenadas 3D de la representación de grano grueso (ver sección siguiente).
La hélice y el modelo 3D
En el núcleo del paquete de predicción de la estructura terciaria de Ernwin se encuentra el modelo reducido de tipo cilíndrico de una hélice de ARN. La representación de la hélice está definida por un segmento de línea que indica los puntos de inicio y de fin del eje de la hélice ( a s , a e ), así como dos vectores que apuntan desde los extremos del eje hasta el centro de la primera y última ( t _ { s , t _ { e} ), tal como se representa en el diagrama esquemático ( Figura 2 , Fig. A.10). El cálculo de estos parámetros no puede representar exactamente una hélice en la medida en que las hélices de ARN se desvíen de una doble hélice ideal. Aunque ya se ha aludido a tal representación ( Laederach et al., 2007; Popenda et al. 2012 ), el cálculo del eje y vectores de torsión nunca ha sido definido explícitamente. Hemos probado cuatro métodos diferentes para la adaptación de hélices idealizada a ARN real doble
...