Los virus representan las formas de vida más abundantes en el planeta
Enviado por Christopher • 7 de Diciembre de 2018 • 3.209 Palabras (13 Páginas) • 355 Visitas
...
Este enfoque de agrupamiento empleado en IMG / VR ha sido modificado del método utilizado anteriormente en Paez-Espino et al. (11), que se basó tanto en la identidad de aminoácidos y la fracción de alineación total para la comparación por parejas de secuencias virales, mediante un método más escalable basado en la identidad de secuencia de nucleótidos (23, 24). Los umbrales rigurosos utilizados (90% de identidad de secuencia de nucleótidos sobre el 75% de la longitud de secuencia) hicieron posible recrear los grupos virales generados en Paez-Espino et al., Recapitulando la especie-leve.
[pic 1]
[pic 2]
Agrupación para el 87% de los clústeres virales, y con el resto agrupando a nivel de género. Identificación del virus del huésped. Tradicionalmente, los virus que infectan bacterias o Archaea (es decir, fagos) han sido aislados del huésped que han estado infectando, y por lo tanto la relación huésped-virus se delineó por adelantado (25). Sin embargo, con el advenimiento de la metagenómica, hay un número creciente de identificación de secuencias virales de muestras ambientales, para las cuales la identificación de un huésped putativo no es tan directa como lo fue para los virus aislados. Se han propuesto una serie de métodos computacionales para evitar esta limitación (11, 26).
IMG / VR proporciona putativo información de acogida de 20 073 secuencias virales (7,5% de todas las secuencias virales) utilizando dos enfoques computacionales como se describe anteriormente (11].
El primer enfoque es buscar clústeres virales que contienen genomas virales aislados con información del huésped. La proyección de la información aislada del huésped viral en el clúster da lugar a una asignación de anfitrión para 862 mVCs. El segundo enfoque depende del sistema inmunitario procariótico CRISPR-Cas, que retiene fragmentos virales (proto-espaciadores) dentro de los arreglos CRISPR microbianos (27, 28, 29). Utilizando este enfoque, 13 474 mVCs fueron asignados a huéspedes putativo.
En total, los genomas de 36 phyla bacteriana y arcaica se vincularon a secuencias virales (Tabla 1]. Un gran número de estas conexiones eran previamente desconocidas, incluyendo la identificación de nueve phyla (Atribacteria, Fervidibacteria, Armatimonadetes, Deferribacteres, Parcubacteria, Gemmatimonadetes, Ignavibacteria, Aminicenantes y Saccharibacteria) que no se informó previamente ser infectado por virus en la base de datos RefSeq de NCBI O como profagos (30).
Navegando iVGs y mVCs a través de conjuntos de datos virales
La funcionalidad de búsqueda en IMG / VR es similar a la del sistema IMG / M (20). Se puede acceder a todos los genomas virales aislados (iVGs) a través de "Quick Genome Search" (tecleando el nombre del virus o el identificador del taxón ('Taxon OID')) o la pestaña 'Find Genomes' (seleccionar virus en 'Genome Browser' o
Herramientas 'Genome Search') (Figura 1). Los mVCs previstos se almacenan como metagenome
Andamios y permanecen bajo sus correspondientes conjuntos de datos de metagenome (es decir, metagenoma 'Taxon OID'). Así, el metagenoma 'Taxon OIDs' también se puede acceder de la misma manera que cualquier iVG y mVCs específicos pueden ser recuperados de la herramienta 'Scaffold Search' de la pestaña 'Find Genomes' (Figura 1). Con el fin de facilitar la identificación y selección de secuencias virales en IMG / VR, se puede acceder a todos los iVGs y mVCs desde la tabla del panel izquierdo (IMG Viral Content) disponible en la página de entrada (página principal) (Figura 2A). Este punto de entrada permite explorar todos los conjuntos de datos virales en el contexto de sus muestras asociadas y metadatos correspondientes, p. El tipo de hábitat o la profundidad de la muestra del metagenoma a partir de la cual se identificó una secuencia viral (Figura 2B). Esta tabla proporciona información sobre el número total de contigs virales por muestra en IMG, permitiendo una rápida identificación de las muestras con mayor número de virus. Similar a otras tablas en IMG, los resultados se pueden exportar en un formato tabdelimited del texto compatible con una serie de otras herramientas para el análisis metagenomic, así como R y Microsoft Excel (figura 2B). Al hacer clic en el número de "Viral Contig Count" de la tabla anterior, los usuarios pueden examinar la lista de contigs virales de muestras individuales (Figura 2C). La información mostrada para un contig o grupo de contigs seleccionado incluye: identificador de andamio (Scaffold ID), conteo de genes por contig (Conteo de Genes), longitud de contig (Longitud de Secuencia bp), contenido de guanina y citosina (GC Content), porcentaje de genes por Contig cubierto con familias de proteínas virales (Perc VPFs), identificador de nombre de especie viral (Viral Cluster, detallado en la sección 'Secuencia agrupación' y Datos complementarios),
Predicción de host y método de predicción (Detección de Host, detallado en la sección 'Host-virus de identificación'), asignación taxonómica a diferentes niveles basados en grupos de genes ortólogos de fagos (POG) (datos complementarios), y las secuencias de retrovirus putativo ).
Visualización de mVCs a través de metadatos ambientales
Los contigs virales metagenómicos se pueden ver en relación con diferentes metadatos ambientales asociados con cada muestra. Dos sistemas distintos de clasificaciones medioambientales
Se muestran en la parte inferior de la página de destino IMG / VR, el ecosistema y la clasificación del tipo de hábitat (11,21,22) (Figura 3).
La clasificación de los ecosistemas se basa en un sistema jerárquico de clasificación de cinco niveles previamente desarrollado (21). Todos los conjuntos de datos metagenome se organizan en tres clases principales de
El nivel superior del ecosistema: diseñado, ambiental y asociado al hospedaje; Y luego se dividen en sub-niveles denominados categoría de ecosistema, tipo de ecosistema, subtipo de ecosistema y
Ecosistema específico (31) (Figura 3A). En la actualidad, el 78,3% de los mVC pertenecen a muestras ambientales, mientras que el 16,3% y el 5,4% corresponden a hospedantes asociados y modificados, respectivamente.
Los usuarios pueden navegar a través de todas las muestras a la vez o simplemente reducir la búsqueda a cualquier clase o categoría específica de ecosistema (es decir,
...