Сходство между сжатыми строками: различия между версиями

Перейти к навигации Перейти к поиску
Строка 58: Строка 58:


== Основные результаты ==
== Основные результаты ==
Задача вычисления сходства двух строк A0 и B0, закодированных при помощи длин серий, была изучена для различных метрик оценки. Бунке и Сирик [ ] первыми предложили решение задачи 1, используя метрику самой длинной общей подпоследовательности. Их алгоритм основан на блочном вычислении таблицы динамического программирования.
Задача вычисления сходства двух строк A' и B', закодированных длинами серий, была изучена для различных метрик оценки. Бунке и Цирик [4] первыми предложили решение задачи 1, используя метрику самой длинной общей подпоследовательности. Их алгоритм основан на блочном вычислении таблицы динамического программирования.




Теорема 1 (Бунке и Цирик, 1995 [ ]). Самая длинная общая подпоследовательность строк A0 и B0, закодированных при помощи длин серий, может быть вычислена за время O(nm0 + n0m).
'''Теорема 1 (Бунке и Цирик, 1995 [4]). Самая длинная общая подпоследовательность строк A' и B', закодированных длинами серий, может быть вычислена за время O(nm' + n'm).'''




Строка 67: Строка 67:




Теорема 2 (Арбелл, Ландау и Митчелл [2]; Макинен, Наварро и Укконен [10]). Расстояние Левенштейна между строками A0 и B0, закодированными при помощи длин серий, может быть вычислена за время O(nm0 + n0m).
Теорема 2 (Арбелл, Ландау и Митчелл [2]; Макинен, Наварро и Укконен [10]). Расстояние Левенштейна между строками A0 и B0, закодированными длинами серий, может быть вычислена за время O(nm0 + n0m).




Строка 73: Строка 73:




Теорема 3 (Крочмор, Ландау и Зив-Укельсон 2003 [6]; Макинен, Наварро и Укконен [11]). Взвешенное расстояние редактирования между строками A0 и B0, закодированными при помощи длин серий, может быть вычислена за время O(nm0 + n0m).
Теорема 3 (Крочмор, Ландау и Зив-Укельсон 2003 [6]; Макинен, Наварро и Укконен [11]). Взвешенное расстояние редактирования между строками A0 и B0, закодированными длинами серий, может быть вычислена за время O(nm0 + n0m).




Строка 80: Строка 80:


Теорема 4 (Ким, Амир, Ландау и Парк, 2005 [8]).
Теорема 4 (Ким, Амир, Ландау и Парк, 2005 [8]).
Сходство между закодированными при помощи длин серий строками A0 и B0 согласно метрике аффинного штрафа за гэп может быть вычислено за время O(nm0 + n0m).
Сходство между закодированными длинами серий строками A0 и B0 согласно метрике аффинного штрафа за гэп может быть вычислено за время O(nm0 + n0m).
   
   


Приведенные выше результаты показывают, что сравнение закодированных при помощи длин серий строк с использованием метрики самой длинной общей подпоследовательности успешно распространяется на метрики оценки более общего плана.
Приведенные выше результаты показывают, что сравнение закодированных длинами серий строк с использованием метрики самой длинной общей подпоследовательности успешно распространяется на метрики оценки более общего плана.




Строка 89: Строка 89:




Теорема 5 (Апостолико, Ландау и Скиена, 1999 [ ]). Самая длинная общая подпоследовательность строк A0 и B0, закодированных при помощи длин серий, может быть вычислена за время O(n0 m0 log(n0 + m0)).
Теорема 5 (Апостолико, Ландау и Скиена, 1999 [ ]). Самая длинная общая подпоследовательность строк A0 и B0, закодированных длинами серий, может быть вычислена за время O(n0 m0 log(n0 + m0)).




Строка 95: Строка 95:




Теорема 6 (Митчелл, 1997 [12]). Самая длинная общая подпоследовательность строк A0 и B0, закодированных при помощи длин серий, может быть вычислена за время O((d + n0 + m0) log(d + n0 + m0)), где d– число совпадений сжатых символов.
Теорема 6 (Митчелл, 1997 [12]). Самая длинная общая подпоследовательность строк A0 и B0, закодированных длинами серий, может быть вычислена за время O((d + n0 + m0) log(d + n0 + m0)), где d– число совпадений сжатых символов.




Строка 101: Строка 101:




Гипотеза 1 (Макинен, Наварро и Укконен, 2003 [11]). Самая длинная подпоследовательность строк A0 и B0, закодированных при помощи длин серий, в среднем может быть вычислена за время O(n0m0).
Гипотеза 1 (Макинен, Наварро и Укконен, 2003 [11]). Самая длинная подпоследовательность строк A0 и B0, закодированных длинами серий, в среднем может быть вычислена за время O(n0m0).




4551

правка

Навигация