Аноним

Точные алгоритмы решения задачи о выполнимости формулы в КНФ общего вида: различия между версиями

Материал из WEGA
м
 
(не показано 9 промежуточных версий этого же участника)
Строка 8: Строка 8:
'''Задача 1 (SAT).'''
'''Задача 1 (SAT).'''


Дано: формула F в КНФ, содержащая n переменных, m дизъюнктов clauses и l литералов.
Дано: формула F в КНФ, содержащая n переменных, m дизъюнктов и l литералов.


Требуется: выдать «Да», если F содержит присваивание, обеспечивающее выполнимость формулы, т. е. подстановку булевых значений переменных, с которой значение F становится истинным, и «Нет» в противном случае.
Требуется: выдать «Да», если для F имеется присваивание, обеспечивающее выполнимость формулы, т. е. подстановку булевых значений переменных, с которой значение F становится истинным, и «Нет» в противном случае.




Границы времени выполнения алгоритмов SAT, таким образом, можно выразить в форме <math>|F|^{O(1)} \cdot \alpha^n, |F|^{O(1)} \cdot \beta^m</math> или <math>|F|^O(1) \cdot \gamma^l</math>, где |F| – длина удовлетворительного битового представления F (т. е. формальных входных данных алгоритма). Фактически для существущих алгоритмов базы <math>\beta</math> и <math>\gamma</math> являются константами, а <math>\alpha</math> – функцией <math>\alpha(n, m)</math> от параметров формулы (поскольку не известно лучшей константы, чем <math>\alpha = 2</math>).
Границы времени выполнения алгоритмов SAT, таким образом, можно выразить в форме <math>|F|^{O(1)} \cdot \alpha^n, |F|^{O(1)} \cdot \beta^m</math> или <math>|F|^O(1) \cdot \gamma^l</math>, где |F| – длина удовлетворительного битового представления F (т. е. формальных входных данных алгоритма). Фактически для существущих алгоритмов базы <math>\beta</math> и <math>\gamma</math> являются константами, а <math>\alpha</math> – функцией <math>\alpha(n, m)</math> от параметров формулы (поскольку не известно константы лучше <math>\alpha = 2</math>).


== Нотация ==
== Нотация ==
Формула в конъюнктивно-нормальной форме представляет собой набор дизъюнктов (понимаемый как конъюнкция этих дизъюнктов), дизъюнкт – набор литералов (понимаемый как дизъюнкция этих литералов), а литерал – либо булеву переменную, либо отрицание булевой переменной. Истинностное присваивание присваивает булевы значения ('''false''' или '''true''') одной или нескольким переменным. Сокращенное присваивание представляет собой список литералов, которые при данном присваивании получают значение '''true''' (например, присваивание значения '''false''' переменной x и значения '''true''' – переменной y обозначается <math>\lnot x, y</math>). Результатом применения присваивания A к формуле F (обозначаемым F[A]) является формула, полученная удалением дизъюнктов, содержащих истинные литералы из F, и удалением ставших ложными литералов из оставшихся дизъюнктов. К примеру, если <math>F = (x \lor \lnot y \lor z) \land (y \lor \lnot z)</math>, то <math>F[ \lnot x, y] = (z)</math>. Присваиванием, обеспечивающим выполнимость формулы F, называется присваивание A, такое, что F[A] = true. Если такое присваивание существует, формула F называется ''выполнимой''.
Формула в конъюнктивно-нормальной форме представляет собой набор дизъюнктов (понимаемый как конъюнкция этих дизъюнктов), дизъюнкт – набор литералов (понимаемый как дизъюнкция этих литералов), а литерал – либо булеву переменную, либо отрицание булевой переменной. Истинностное присваивание присваивает булевы значения ('''false''' или '''true''') одной или нескольким переменным. Сокращенное присваивание представляет собой список литералов, которые при данном присваивании получают значение '''true''' (например, присваивание значения '''false''' переменной x и значения '''true''' – переменной y обозначается <math>\lnot x, y</math>). Результатом применения присваивания A к формуле F (обозначаемым F[A]) является формула, полученная удалением из F дизъюнктов, содержащих истинные литералы, и удалением ставших ложными литералов из оставшихся дизъюнктов. К примеру, если <math>F = (x \lor \lnot y \lor z) \land (y \lor \lnot z)</math>, то <math>F[ \lnot x, y] = (z)</math>. ''Присваиванием, обеспечивающим выполнимость'' формулы F, называется присваивание A, такое, что F[A] = '''true'''. Если такое присваивание существует, формула F называется ''выполнимой''.


== Основные результаты ==
== Основные результаты ==
Строка 25: Строка 25:




Тривиальный алгоритм перебора, перечисляющий все возможные присваивания n переменным, выполняется за <math>2^n</math> шагов с полиномиальным временем. Таким образом, <math>\alpha \le 2</math>; по тривиальной причине <math>\beta, \gamma \le 2</math>. В начале 80-х Мониен и Спекенмейер заметили, что <math>\beta</math> можно сделать меньше. ''//И они, и другие исследователи также отметили, что a можно сделать меньше для специального случая задачи, в котором длина каждого дизъюнкта ограничена константой; соответствующие ссылки и алгоритмы см. в статье «Алгоритмы локального поиска для k-КНФ».//''
Тривиальный алгоритм перебора, перечисляющий все возможные присваивания n переменным, выполняется за <math>2^n</math> шагов с полиномиальным временем. Таким образом, <math>\alpha \le 2</math>; по тривиальной причине <math>\beta, \gamma \le 2</math>. В начале 80-х Мониен и Спекенмейер заметили, что <math>\beta</math> можно сделать меньше. ''//И они, и другие исследователи также отметили, что <math>\alpha</math> можно сделать меньше для специального случая задачи, в котором длина каждого дизъюнкта ограничена константой; соответствующие ссылки и алгоритмы см. в статье «[[Алгоритмы локального поиска для k-КНФ]]».//''
Затем Куллманн и Лукхардт [12] разработали схему для алгоритмов SAT типа «разделяй и властвуй» ''//также называемых DPLL в связи со статьями Дэвиса и Патнем [7] и Дэвиса, Логемана и Лавленда [6]//'', которая разбивала исходную задачу на несколько (как правило, постоянное число) подзадач, подставляя значения некоторых переменных и упрощая полученные формулы. В результате этого исследования были получены следующие верхние пределы для <math>\beta</math> и <math>\gamma</math>:
Затем Куллманн и Лукхардт [12] разработали схему для алгоритмов SAT типа «разделяй и властвуй» ''//также называемых DPLL в силу его связи со статьями Дэвиса и Патнем [7] и Дэвиса, Логемана и Лавленда [6]//'', которая разбивала исходную задачу на несколько (как правило, постоянное число) подзадач, подставляя значения некоторых переменных и упрощая полученные формулы. В результате этого исследования были получены следующие верхние пределы для <math>\beta</math> и <math>\gamma</math>:




Строка 40: Строка 40:
<math>T(F) \le \sum_{i=1}^k T(F'_i) + const,</math>
<math>T(F) \le \sum_{i=1}^k T(F'_i) + const,</math>


давало желаемую верхнюю границу по количеству листьев в дереве рекуррентности и, следовательно, по времени работы алгоритма. В частности, для получения границы <math>|F|^{O(1)} \cdot 2^{0,30897m};</math> необходимо решить либо две подзадачи F[x], F[<math>\lnot</math>x] с рекуррентным неравенством
давало желаемую верхнюю границу по количеству листьев в дереве рекуррентности и, следовательно, по времени работы алгоритма. В частности, для получения границы <math>|F|^{O(1)} \cdot 2^{0,30897m}</math> необходимо решить либо две подзадачи F[x], F[<math>\lnot</math>x] с рекуррентным неравенством


<math>t_m \le t_{m - 3} + t_{m - 4}</math>
<math>t_m \le t_{m - 3} + t_{m - 4}</math>
Строка 48: Строка 48:
<math>t_m \le 2t_{m - 6} + 2t_{m - 7},</math>
<math>t_m \le 2t_{m - 6} + 2t_{m - 7},</math>


где <math>t_i = max_{m(G)\le i} T(G)</math>. Правила упрощения, используемые в алгоритмах со временем выполнения <math>|F|^{O(1)} \cdot 2^{0,30897m};</math> и <math>|F|^{O(1)} \cdot 2^{0,10299l}.</math>, выглядят следующим образом.
где <math>t_i = max_{m(G)\le i} T(G)</math>. Правила упрощения, используемые в алгоритмах со временем выполнения <math>|F|^{O(1)} \cdot 2^{0,30897m}</math> и <math>|F|^{O(1)} \cdot 2^{0,10299l}</math>, выглядят следующим образом.




Строка 70: Строка 70:
   
   


== '''''Исключение переменной путем резолюции [7]''''' ==
'''''Исключение переменной путем резолюции [7]'''''


Пусть имеется литерал <math>a</math>. Построить формулу <math>DP_a(F)</math> следующим образом:
Пусть имеется литерал <math>a</math>. Построить формулу <math>DP_a(F)</math> следующим образом:
Строка 90: Строка 90:
'''Лемма 2''' (Куллман [11])
'''Лемма 2''' (Куллман [11])


(1) Если дизъюнкт C заблокирован для литерала a относительно F, то F и F nfCg являются в равной мере выполнимыми.
(1) Если дизъюнкт C заблокирован для литерала a относительно F, то F и F \ {C} являются в равной мере выполнимыми.


(2) Пусть имеется литерал a. Формула F является выполнимой в том и только том случае, если по меньшей мере одна из формул F[:a] и F[I(a; F)] является выполнимой.
(2) Пусть имеется литерал <math>a</math>. Формула F является выполнимой в том и только том случае, если по меньшей мере одна из формул <math>F [ \neg a ]</math> и <math>F[I(a, F)]</math> является выполнимой.


Первое утверждение леммы применяется в качестве правила упрощения.
Первое утверждение леммы применяется в качестве правила упрощения.
Строка 99: Строка 99:
'''''Применение принципа «черного и белого литералов»'''''
'''''Применение принципа «черного и белого литералов»'''''


Пусть P – бинарное отношение между литералами и формулами в КНФ, такое, что для переменной v и формулы F выполняется не более чем одно из выражений P(v; F) и P(:v; F).
Пусть P – бинарное отношение между литералами и формулами в КНФ, такое, что для переменной v и формулы F выполняется не более чем одно из выражений P(v, F) и P(<math>\neg</math> v, F).




'''Лемма 3.''' Предположим, что каждый дизъюнкт F, содержащий литерал w, удовлетворяющий P(w; F), также содержит по меньшей мере один литерал b, удовлетворяющий P(:b;F). Тогда F и F[fljP(:l;F)g] являются в равной мере выполнимыми.
'''Лемма 3.''' Предположим, что каждый дизъюнкт F, содержащий литерал w, удовлетворяющий P(w, F), также содержит по меньшей мере один литерал <math>b</math>, удовлетворяющий <math>P(\neg b, F)</math>. Тогда <math>F</math> и <math>F[ \{ l | P( \neg l, F) \} ]</math> являются в равной мере выполнимыми.




'''''Граница для <<math>\gamma</math>'''''
'''''Граница для <math>\gamma</math>'''''


Для получения границы jFjO(1) • 20:10299l достаточно использовать пару F[:a]; F[I(a; F)] подзадач (см. лемму 2(2)), обеспечивающую необходимое рекуррентное неравенство tl < f,_5 + f;_17, и перейти к алгоритму с временем выполнения jFjO(1) • 2°:30897m, если таковой нет. Недавнее и намного более технически сложное улучшение этого алгоритма [16] обеспечивает границу jFjO(1) • 2°:0926l.
Для получения границы <math>|F|^{O(1)} \cdot 2^{0,10299l}</math> достаточно использовать пару <math>F[\neg a], F[I(a, F)]</math> подзадач (см. лемму 2(2)), обеспечивающую необходимое рекуррентное неравенство <math>t_l \le t_{l - 5} + t_{l - 17}</math>, и перейти к алгоритму с временем выполнения <math>|F|^{O(1)} \cdot 2^{0,30897m}</math>, если таковой пары нет. Недавнее и намного более технически сложное улучшение этого алгоритма [16] обеспечивает границу <math>|F|^{O(1)} \cdot 2^{0,0926l}.</math>




'''''Граница для <math>\alpha</math>'''''
'''''Граница для <math>\alpha</math>'''''


В настоящее время нетривиальная константная верхняя граница для a неизвестна. Однако, начиная с работы [ ], были предложены любопытные неконстнатнеы границы. Был разработан ряд рандомизированных и детерминированных алгоритмов, демонстрирующих последовательные улучшения. Лучшая на данный момент возможная граница достигается при помощи детерминированного алгоритма «разделяй и властвуй», применяющего следующую рекурсивную процедуру. Его заключается в дихотомии: либо каждый дизъюнкт входной формулы можно сократить до первых k литералов (тогда можно применить алгоритм k-КНФ), либо все эти литералы в одном из дизъюнктов можно считать ложными. Такой подход к сокращению дизъюнктов можно приписать Шулеру [ ], который использовал его в рандомизированной форме. Следующая версия детерминированного алгоритма, достигающего лучшей известной границы как для детерминированных, так и для рандомизированных алгоритмов, приведена в [5]).
В настоящее время нетривиальная константная верхняя граница для <math>\alpha</math> неизвестна. Однако, начиная с работы [14], были предложены любопытные неконстантные границы. Был разработан ряд рандомизированных и детерминированных алгоритмов, демонстрирующих последовательные улучшения. Лучшая на данный момент возможная граница достигается при помощи детерминированного алгоритма «разделяй и властвуй», применяющего следующую рекурсивную процедуру. Его идея заключается в дихотомии: либо каждый дизъюнкт входной формулы можно сократить до первых k литералов (тогда можно применить алгоритм k-КНФ), либо все эти литералы в одном из дизъюнктов можно считать ложными. Такой подход к сокращению дизъюнктов можно приписать Шулеру [15], который использовал его в рандомизированной форме. Следующая версия детерминированного алгоритма, достигающего лучшей известной границы как для детерминированных, так и для рандомизированных алгоритмов, приведена в [5]).




Строка 119: Строка 119:
Дано: КНФ-формула F и положительное целое число k.
Дано: КНФ-формула F и положительное целое число k.


1. Предположим, формула F состоит из дизъюнктов C1, ..., Cm. Заменим каждый дизъюнкт Ci дизъюнктом Д следующим образом: если j C i j  > k, выбрать любые k литералов в Ci и отбросить все остальные литералы; в противном случае оставить Ci неизменным, т. е. Di = Ci. Обозначить полученную формулу как F0.
1. Предположим, формула F состоит из дизъюнктов <math>C_1, ..., C_m</math>. Заменим каждый дизъюнкт <math>C_i</math> дизъюнктом <math>D_i</math> следующим образом: если <math>|C_i| > k</math>, выбрать любые k литералов в <math>C_i</math> и отбросить все остальные литералы; в противном случае оставить <math>C_i</math> неизменным, т. е. <math>D_i = C_i</math>. Обозначить полученную формулу как F'.


2. Проверить выполнимость формулы F0 с помощью алгоритма k-КНФ с времерем выполнения m poly(n) (2 2/ (k + 1))n, определенного в работе [3].
2. Проверить выполнимость формулы F' с помощью алгоритма k-КНФ с временем выполнения <math>m \cdot poly(n) \cdot (2 - 2/(k + 1))^n</math>, определенного в работе [3].


3. Если формула F0 является выполнимой, вывести «Формула выполнима» и остановить выполнение. В противном случае для каждого значения i выполнить следующее:
3. Если формула F' является выполнимой, вывести «Формула выполнима» и остановить выполнение. В противном случае для каждого значения i выполнить следующее:


(а) Преобразовать F в Fi следующим образом:
(а) Преобразовать F в <math>F_i</math> следующим образом:


11.  Заменить Cj на Dj для всех j < i;
11.  Заменить <math>C_j</math> на <math>D_j</math> для всех j < i;


12. Присвоить всем литералам Д значение false.
12. Присвоить всем литералам <math>D_i</math> значение ''false''.


(б) Рекурсовно вызвать процедуру S на (Fi, k).
(б) Рекурсивно вызвать процедуру S для значений (<math>F_i</math>, k).


4. Вернуть «Формула невыполнима».
4. Вернуть «Формула невыполнима».




Алгоритм вызывает процедуру S для исходной формулы и целочисленного параметра k = k * (m, n). Из наиболее точного анализа данного семейства алгоритмов, выполненного Калабро, Импальяццо и Патури [ ], следует, что, предполагая, что m > n, можно получить следующую границу, приняв k(m; n) = 2log(m/n) + const. (Эта явная граница не задана в [ ] и выводится в [4].)
Алгоритм вызывает процедуру S для исходной формулы и целочисленного параметра k = k * (m, n). Из наиболее точного анализа данного семейства алгоритмов, выполненного Калабро, Импальяццо и Патури [1], следует, что, предполагая, что m > n, можно получить следующую границу, приняв k(m, n) = 2 log(m/n) + const. (Эта явная граница не задана в [1] и выводится в [4].)




'''Теорема 4 (Данцин, Хирш [ ]). Предполагая, что m > n, задачу SAT можно решить за время'''
'''Теорема 4 (Данцин, Хирш [4]). Предполагая, что m > n, задачу SAT можно решить за время <math>|F|^{O(1)} \cdot 2^{n \big (1 - \frac{1}{O(log(m/n))} \big ) }.</math>'''


== Применение ==
== Применение ==
Строка 145: Строка 145:


== Открытые вопросы ==
== Открытые вопросы ==
Основными нерешенными вопросами в данной области остаются доказательство наличия постоянной верхней границы на a < 2, а также гипотетическое существование алгоритмов с временем выполнения (1 + ") для произвольного малого " > 0. Можно провести анализ алгоритма «разделяй и властвуй» и даже автоматически генерировать правила упрощения [10]. Однако пока такой подход позволил получить новые границы только для (NP-полной) версии оптимизации 3-КНФ [9].
Основными нерешенными вопросами в данной области остаются доказательство наличия постоянной верхней границы на <math>\alpha < 2</math>, а также гипотетическое существование алгоритмов с временем выполнения <math>(1 + \varepsilon)^l</math> для произвольного малого <math>\varepsilon > 0</math>.
 
Можно провести анализ алгоритма «разделяй и властвуй» и даже автоматически генерировать правила упрощения [10]. Однако пока такой подход позволил получить новые границы только для (NP-полной) версии оптимизации 2-КНФ [9].


== Экспериментальные результаты ==
== Экспериментальные результаты ==
Ван Цзюнь реализовал алгоритм, дающий границу для f$, и собрал некоторую статистику по количеству применений правил упрощения [17].
Ван Цзюнь реализовал алгоритм, дающий границу для <math>\beta</math>, и собрал некоторую статистику по количеству применений правил упрощения [17].


== См. также ==
== См. также ==
4446

правок