Аноним

Сравнение с шаблоном для сжатого текста: различия между версиями

Материал из WEGA
м
Строка 14: Строка 14:
<math>a</math> для <math>a \in \Sigma \cup \{ \epsilon \}</math> (примитивное присваивание)
<math>a</math> для <math>a \in \Sigma \cup \{ \epsilon \}</math> (примитивное присваивание)


<math>X_i X_j</math> для i,j < k (конкатенация)
<math>X_i X_j</math> для i, j < k (конкатенация)


<math>^{[j]}X_i</math> для i < k и целого положительного числа j (усечение префикса длины j)
<math>^{[j]}X_i</math> для i < k и целого положительного числа j (усечение префикса длины j)
Строка 23: Строка 23:




Под ''усечением префикса (или суффикса) длины j'' мы понимаем операцию над строками, которая берет строку w и возвращает строку, полученную из w путем удаления ее префикса (или суффикса) длины j. Переменные <math>X_k</math> представляют строки <math>\bar{X_k}</math>, полученные путем оценки их выражений. ''Размером'' <math>\mathcal{D}</math> является количество n присваиваний, обозначаемое <math>|\mathcal{D}|</math>. обозначим за <math>height(\mathcal{D})</math> максимальную зависимость в <math>\mathcal{D}</math>. <math>\mathcal{S}</math> – это последовательность <math>X_{i_1} ... X_{j_\ell}</math> переменных, определенных в <math>\mathcal{D}</math>. ''Длина'' <math>\mathcal{S}</math> представляет собой количество <math>\ell</math> переменных в <math>\mathcal{S}</math> и обозначается <math>|\mathcal{S}|</math>. Таким образом, можно считать, что <math>|\mathbf{c}(T)| = |\mathcal{D}| + |\mathcal{S}|</math>.
Под ''усечением префикса (или суффикса) длины j'' мы понимаем операцию над строками, которая берет строку w и возвращает строку, полученную из w путем удаления ее префикса (или суффикса) длины j. Переменные <math>X_k</math> представляют строки <math>\bar{X_k}</math>, полученные путем оценки их выражений. ''Размером'' <math>\mathcal{D}</math> является количество n присваиваний, обозначаемое <math>|\mathcal{D}|</math>. Обозначим за <math>height(\mathcal{D})</math> максимальную зависимость в <math>\mathcal{D}</math>. <math>\mathcal{S}</math> – это последовательность <math>X_{i_1} ... X_{j_\ell}</math> переменных, определенных в <math>\mathcal{D}</math>. ''Длина'' <math>\mathcal{S}</math> представляет собой количество <math>\ell</math> переменных в <math>\mathcal{S}</math> и обозначается <math>|\mathcal{S}|</math>. Таким образом, можно считать, что <math>|\mathbf{c}(T)| = |\mathcal{D}| + |\mathcal{S}|</math>.




Строка 31: Строка 31:




Система коллажей <math>\langle \mathcal{D}, \mathcal{S} \rangle</math> представляет собой строку, полученную путем конкатенации строк <math>\bar{X_{i_1}}, ..., \bar{X_{j_\ell}}</math>, представленных переменными <math>X_{i_1}, ..., X_{j_\ell}</math> из <math>\mathcal{S}</math>. Следует отметить, что любая система коллажей может быть преобразована в систему с <math>|\mathcal{S}| = 1</math> путем добавления серии присваиваний с операциями конкатенации в <math>\mathcal{D}</math>. Это может означать, что <math>\mathcal{S}</math> не нужна. Однако разнообразные схемы сжатия могут быть естественным образом отражены путем разделения <math>\mathcal{D}</math> (определение ''фраз'') и <math>\mathcal{S}</math> (результатом чего является факторизация текста T на фразы). Способы выражения сжатых текстов для существующих схем сжатия можно найти в [9].
Система коллажей <math>\langle \mathcal{D}, \mathcal{S} \rangle</math> представляет собой строку, полученную путем конкатенации строк <math>\bar{X_{i_1}}, ..., \bar{X_{j_\ell}}</math>, представленных переменными <math>X_{i_1}, ..., X_{j_\ell}</math> из <math>\mathcal{S}</math>. Следует отметить, что любая система коллажей может быть преобразована в систему с <math>|\mathcal{S}| = 1</math> путем добавления в <math>\mathcal{D}</math> серии присваиваний с операциями конкатенации. Это может означать, что <math>\mathcal{S}</math> не нужна. Однако разнообразные схемы сжатия могут быть естественным образом отражены путем разделения <math>\mathcal{D}</math> (определение ''фраз'') и <math>\mathcal{S}</math> (результатом чего является факторизация текста T на фразы). Способы выражения сжатых текстов для существующих схем сжатия можно найти в [9].




4446

правок