4501
правка
Irina (обсуждение | вклад) |
Irina (обсуждение | вклад) мНет описания правки |
||
(не показано 8 промежуточных версий этого же участника) | |||
Строка 1: | Строка 1: | ||
== Ключевые слова и синонимы == | == Ключевые слова и синонимы == | ||
Парное локальное выравнивание с аффинными штрафами за | Парное локальное выравнивание с аффинными штрафами за гэп | ||
== Постановка задачи == | == Постановка задачи == | ||
Строка 6: | Строка 6: | ||
Пусть даны две последовательности, S и T. Парное выравнивание представляет собой способ вставки символов пробелов '_' в S и T для формирования последовательностей S' и T', соответственно, с той же длиной. Выравнивание двух последовательностей может производиться различными способами. Оценка выравнивания измеряется метрикой <math>\delta(x, y)</math>. В каждой позиции i, где x и y не являются пробелами, сходство между S'[i] и T'[i] измеряется <math>\delta(S'[i], T'[j])</math>. Обычно <math>\delta(x, y)</math> положительно, когда x и y одинаковы, и отрицательно, когда x и y различны. Для позиций с последовательными символами пробела оценки выравнивания символов пробела не рассматриваются независимо; это связано с тем, что вставка или удаление длинного участка в молекулярных последовательностях более вероятна, чем вставка или удаление нескольких коротких участков. Смит и Уотермен используют аффинный штраф за гэп для моделирования сходства в позициях с символами пробелов. Они определяют последовательную подстроку с пробелами в S' или T' как гэп. Для каждого гэпа длиной <math>l</math> они назначают линейный штраф <math>W_k = W_s + l \times W_p</math> | Пусть даны две последовательности, S и T. Парное выравнивание представляет собой способ вставки символов пробелов '_' в S и T для формирования последовательностей S' и T', соответственно, с той же длиной. Выравнивание двух последовательностей может производиться различными способами. Оценка выравнивания измеряется метрикой <math>\delta(x, y)</math>. В каждой позиции i, где x и y не являются пробелами, сходство между S'[i] и T'[i] измеряется значением <math>\delta(S'[i], T'[j])</math>. Обычно <math>\delta(x, y)</math> положительно, когда x и y одинаковы, и отрицательно, когда x и y различны. Для позиций с последовательными символами пробела оценки выравнивания символов пробела не рассматриваются независимо; это связано с тем, что вставка или удаление длинного участка в молекулярных последовательностях более вероятна, чем вставка или удаление нескольких коротких участков. Смит и Уотермен используют аффинный штраф за гэп для моделирования сходства в позициях с символами пробелов. Они определяют последовательную подстроку с пробелами в S' или T' как ''гэп''. Для каждого гэпа длиной <math>l</math> они назначают линейный штраф <math>W_k = W_s + l \times W_p</math>, где <math>W_s</math> и <math>W_p</math> – некоторые заранее определенные положительные константы. Оценка выравнивания представляет собой сумму оценок в каждой позиции i минус штрафы за каждый гэп. Например, оценка следующего выравнивания равна <math>\delta(G, G) + \delta(C, C) + \delta(C, C) + \delta(U, C) + \delta(G, G) - (W_s + 2 \times W_p)</math>. | ||
S: GCCAUUG | S: GCCAUUG | ||
Строка 14: | Строка 13: | ||
Оптимальное глобальное выравнивание последовательностей S и T – это выравнивание S и T с максимальной выравнивания. | Оптимальное глобальное выравнивание последовательностей S и T – это выравнивание S и T с максимальной оценкой выравнивания. | ||
Иногда мы хотим узнать, содержат ли последовательности S и T похожие подстроки, а не то, похожи ли S и T. В этом случае решается задача парного локального выравнивания, которая заключается в поиске подстроки U в последовательности S и другой подстроки V в T, такой, что глобальная оценка выравнивания U и V максимальна. | |||
Строка 22: | Строка 23: | ||
Требуется: найти подстроку U в S и подстроку V в T, такие, что оптимальное глобальное выравнивание U и V максимально. | Требуется: найти подстроку U в S и подстроку V в T, такие, что оптимальное глобальное выравнивание U и V максимально. | ||
== Основные результаты == | == Основные результаты == | ||
Строка 37: | Строка 37: | ||
Оценка оптимального локального выравнивания S и T будет равна max {H(i, j)}, а локальное выравнивание S и T может быть найдено путем обратного обхода таблицы H. | Оценка оптимального локального выравнивания S и T будет равна max{H(i, j)}, а локальное выравнивание S и T может быть найдено путем обратного обхода таблицы H. | ||
Строка 65: | Строка 65: | ||
== Применение == | == Применение == | ||
Локальное выравнивание с аффинными штрафами за | Локальное выравнивание с аффинными штрафами за гэп может использоваться для классификации белков, филогенетического футпринтинга и идентификации функциональных элементов последовательности. | ||
== Ссылка на код == | == Ссылка на код == | ||
Строка 71: | Строка 71: | ||
== См. также == | == См. также == | ||
* [[Эффективные методы множественного выравнивания последовательностей с гарантированными границами | * [[Эффективные методы множественного выравнивания последовательностей с гарантированными границами ошибок]] | ||
* [[Локальное выравнивание (с вогнутыми штрафами за | * [[Локальное выравнивание (с вогнутыми штрафами за гэп)]] | ||
== Литература == | == Литература == |
правка