Metodo blast.
Enviado por Stella • 4 de Mayo de 2018 • 2.585 Palabras (11 Páginas) • 429 Visitas
...
II. DESCRIPCIÓN GENERAL DE LA ALINEACIÓN DE SECUENCIA
ALGORITMOS
Needleman - Wunsch es un algoritmo bien knoxm para el mundial alineación basada en el concepto de programación dinámica pero es adecuada para secuencias cortas y se vuelve muy reducir la velocidad en caso de secuencias largas (La hora de la complejidad algoritmo de Needleman Wunsch es O (MN)). Herrero- Waterman algoritmo hace la alineación local y compara todos bases contra de todas las bases que es claramente demasiado lento su tiempo complejidad es el mismo que para Needleman - Wunsch algoritmo Una solución de este enfoque se da por BLAST1151 que encontrar semillas partidos cortos exactas que después los correspondientes al ya la alineación
A. FASTA y BLAST la Familia FASTA y BLAST
ambos son métodos heurísticos de podar el espacio de búsqueda mediante el uso de métodos aproximados rápidos para seleccionar las secuencias de la base de datos que es probable que sean similares a la consulta y para localizar la región de similitud dentro de ellos. El algoritmo FASTA realiza optimización local de porciones de modo que difieren de la secuencia fuera de la región de la alineación optimizada no afectan a la puntuación de la alineación. Para refinar la búsqueda se utiliza el algoritmo FASTA la tabla de búsqueda es más rápida para localizar todas las identidades o grupos de identidades entre dos secuencias de ADN o de aminoácidos para la primera etapa de comparación. En conjunción con la tabla de búsqueda que utiliza el método diagonal para encontrar todas las regiones de similitud entre las dos secuencias. La velocidad y la sensibilidad es controlado por el parámetro llamado ktup (k touple) que especifica el tamaño de la palabra. Menor el valor ktup más sensible es la búsqueda por ktup por defecto = 2 es para la búsqueda Proteina y 4 o 6 es por de nucleótidos. Este método identifica región de una diagonal que tiene la mayor densidad de partidos ktup. FASTA utiliza una fórmula para anotando partidos ktup que incorporan el pam real 250 valores de residuos alineados. FASTA ahorra algo mejor locales regiones, independientemente de si existen o no en la misma o en diferentes diagonales. Estas pocas regiones de alta puntuación son alineaciones parciales sin lagunas. Entonces algoritmo FASTA comprueba que si hay varias regiones iniciales con puntaje mayor que el punto de corte se comprueba si se pueden unir para obtener un alineamiento con huecos.
BLAST también trabaja en el local similitud de secuencias. Eso Busca la máxima par de segmentos, que es el más alto anotando par de segmentos de longitud idéntica elegido entre dos secuencias. (La MSP debe ser localmente máximo significa. El marcador no puede ser mejorada mediante la ampliación o acortando los dos segmentos y está por encima de algunos de corte). Entonces lo hace una rápido aproximación de las puntuaciones del MSP. La secuencia de base de datos es enorme pero sólo un puñado de secuencias se homóloga a la secuencia de consulta. Para hacer una búsqueda rápida.
BLAST busca para una palabra de longitud fija w. La principal estrategia de ráfaga es buscar un único par segmento que contiene un par de palabras con una puntuación de al menos T. Cualquier golpe es extendido a determinar que si está contenido dentro de una pareja de segmentos cuya puntuación es mayor que o igual a S. menor valor de tiempo T del algoritmo de búsqueda FASTA generalmente requieren mucho más tiempo que la ejecución Sin embargo la explosión búsqueda FASTA son algoritmos considerado por algunos a ser más sensible que BLAST, sobre todo cuando la secuencia problema es repetitivo.
B. LA ALINEACIÓN GAPPED
Gapped BLAST o PSI - Blast es una versión refinada de explosión se ejecuta tres veces más rápido que el BLAST original Utiliza un método que convierte alineaciones estadísticamente significativas producido por BLAST en una matriz de puntuación específica de posición. La etapa de extensión en el algoritmo BLAST realiza tiempo máximo , para reducir este tiempo PSI- BLAST propone dos métodos que busca la existencia de dos palabras que no se superponen en la misma diagonal y dentro de una distancia A entre sí. En aras de la sensibilidad del parámetro T debe bajar. El BLAST tiene 2 SECUENCIAS el programa encuentra múltiples alineamientos locales entre dos secuencias, lo que permite al usuario detectar dominios de proteínas homólogas o secuencia interna de duplicaciones. ' Blast 2 SECUENCIAS ' es un sistema interactivo herramienta que utiliza el motor de BLAST para ADN pairwise ADN o proteína-proteína de comparación de secuencias y se basa en el mismo algoritmo y estadísticas de alineamientos locales .El algoritmo BLAST 2.0 genera una alineación con huecos mediante el uso de programación dinámica para ampliar el par central de alineado de residuos . Esta herramienta se adapta mejor a la mayoría Para comparar dos secuencias que ya se sabe que son homólogos.
C. ALGORITMOS DE BASE DE DATOS PREPROCESADAS
Existen métodos de comparación de secuencias que preprocesan la base de datos de tal manera que BLAST y SSAHA que son diseñados para encontrar coincidencias cuando la consulta y la base de datos subsecuentes son muy similares. El índice de Megablast preprocesa la base de datos en una estructura de datos para una rápida búsqueda de semillas. El índice de Mega BLAST es la parte de BLASTn programa en el que el kit de herramientas NCBI C ++ se procesa previamente a la base de datos en lugar de la consulta para construir una estructura de datos para la fase de búsqueda de semillas. esto hace un índice de base de datos que contiene datos de la secuencia comprimidos y las ubicaciones de kmers.el índice de la base de datos se compone de tres cabecera de sección, secuencia de datos y datos de corrección. La sección de encabezado contiene el rango de secuencia en la base de datos, versión del formato, etc., almacena los datos de secuencia de datos de secuencias en forma comprimida y los datos de corrección contienen la tabla de consulta y la lista de desplazamiento. Los índices de tiendas miBLAS y sólo los identificadores de secuencia que contiene ese Kmer pero no el desplazamiento. El resultado del índice. Megablast muestran que su rendimiento es mejor que miBIAST por al menos 2,5 veces en la mayoría de los casos. miBLAST es mejor en pequeñas consultas.
D. MÉTODO SEMILLA DE ESPACIADOS: MEJORA DE LA SIEMBRA
Una semilla que permite desajustes internos se llama semilla de espaciados. El número de coincidencias
...