4430
правок
Irina (обсуждение | вклад) Нет описания правки |
Irina (обсуждение | вклад) Нет описания правки |
||
Строка 5: | Строка 5: | ||
Недавно Даскалакис и коллеги [5] показали, что задача вычисления равновесия Нэша для игры с четырьмя и более игроками является PPAD-полной; этот результат был впоследствии распространен на игры с тремя игроками [8]. В конечном счете, Чен и Денг [3] доказали, что задача является PPAD-полной также и для игр с двумя игроками. | Недавно Даскалакис и коллеги [5] показали, что задача вычисления равновесия Нэша для игры с четырьмя и более игроками является PPAD-полной; этот результат был впоследствии распространен на игры с тремя игроками [8]. В конечном счете, Чен и Денг [3] доказали, что задача является PPAD-полной также и для игр с двумя игроками. | ||
В результате появилась задача вычисления приближенного равновесия Нэша. На настоящий момент было опубликовано несколько вариантов приближенного равновесия Нэша; здесь будут рассмотрены понятия | В результате появилась задача вычисления приближенного равновесия Нэша. На настоящий момент было опубликовано несколько вариантов приближенного равновесия Нэша; здесь будут рассмотрены понятия <math>\epsilon \, </math>-равновесия Нэша и <math>\epsilon \, </math>-поддерживаемого равновесия Нэша. <math>\epsilon \, </math>-равновесие Нэша представляет собой профиль стратегии, такой, что ни один игрок, изменяющий решение, не может получить выигрыш больше, чем выигрыш при определенном профиле стратегии плюс <math>\epsilon \, </math>. Более строгим является понятие <math>\epsilon \, </math>-поддерживаемых равновесий Нэша; они представляют собой профили стратегий, такие, что каждый игрок использует только чистые стратегии с приближенно лучшим ответом с ненулевой вероятностью. | ||
Нотация | Нотация | ||
Строка 17: | Строка 17: | ||
== Приближенное равновесие Нэша == | == Приближенное равновесие Нэша == | ||
Определение 1 ( | Определение 1 (<math>\epsilon \, </math>-равновесие Нэша) | ||
Для любого | Для любого <math>\epsilon \, </math> > 0 стратегический профиль (x, y) является <math>\epsilon \, </math>-равновесием Нэша для биматричной игры Г = A, B с матрицами n × m, если | ||
1. Для всех чистых стратегий i {1, …, n} игрока по строкам eTi Ay ≤ xT Ay + | 1. Для всех чистых стратегий i {1, …, n} игрока по строкам eTi Ay ≤ xT Ay + <math>\epsilon \, </math>; | ||
2. Для всех чистых стратегий j {1, …, m} игрока по столбцам xT Bej ≤ xT By + | 2. Для всех чистых стратегий j {1, …, m} игрока по столбцам xT Bej ≤ xT By + <math>\epsilon \, </math>. | ||
Определение 2 ( | Определение 2 (<math>\epsilon \, </math>-поддерживаемое равновесие Нэша) | ||
Для любого | Для любого <math>\epsilon \, </math> > 0 стратегический профиль (x, y) является <math>\epsilon \, </math>-поддерживаемым равновесием Нэша для биматричной игры Г = A, B с матрицами n × m, если | ||
1. Для всех чистых стратегий i {1, …, n} игрока по строкам | 1. Для всех чистых стратегий i {1, …, n} игрока по строкам | ||
Строка 29: | Строка 29: | ||
Заметим, что оба понятия приближенного равновесия определяются с использованием члена аддитивной ошибки | Заметим, что оба понятия приближенного равновесия определяются с использованием члена аддитивной ошибки <math>\epsilon \, </math>. Хотя (точные) равновесия Нэша, как известно, не поддаются положительному масштабированию, важно отметить, что приближенные версии масштабированию поддаются. В силу этого широко используемое в литературе предположение, относящееся к приближенным равновесиям Нэша, заключается в том, что биматричная игра является положительно нормализованной, и это предположение принято в данном изложении. | ||
== Основные результаты == | == Основные результаты == | ||
В работе Альтхофера [1] показано, что для любого вектора вероятности p существует вектор вероятности p с логарифмической поддержкой, так что для фиксированной матрицы C maxj |pTCej – TCej| ≤ | В работе Альтхофера [1] показано, что для любого вектора вероятности p существует вектор вероятности p с логарифмической поддержкой, так что для фиксированной матрицы C maxj |pTCej – TCej| ≤ <math>\epsilon \, </math> для любой константы <math>\epsilon \, </math> > 0. Используя этот факт, Липтон, Маркакис и Мета [13] показали, что для любой биматричной игры и для любой константы <math>\epsilon \, </math> > 0 существует <math>\epsilon \, </math>-равновесие Нэша с только логарифмической поддержкой (от числа доступных чистых стратегий n). Рассмотрим биматричную игру Г = A, B. Пусть let (x, y) – равновесие Нэша для Г. Зафиксируем положительное число k и сформируем мультимножество S1, выполнив выборку k раз из множества чистых стратегий игрока по строкам независимым случайным образом в соотвествии с распределением x. Сформируем подобным же образом мультимножество S2, выполнив выборку k раз из множества чистых стратегий игрока по столбцам в соответствии с распределением y. Пусть – смешанная стратегия для игрока по строкам, которая назначает вероятность 1/k каждому члену S1 и 0 – всем остальным чистым стратегиям, а – смешанная стратегия для игрока по столбцам, которая назначает вероятность 1/k каждому члену S2 и 0 – всем остальным чистым стратегиям. Тогда x и у называются k-однородными [13], и для них выполняется | ||
Теорема 1 ([13]) Для любого равновесия Нэша (x, y) биматричной игры с матрциами n х n и для любого | Теорема 1 ([13]) Для любого равновесия Нэша (x, y) биматричной игры с матрциами n х n и для любого <math>\epsilon \, </math> > 0 существует, для каждого k (12 ln n)/<math>\epsilon \, </math>2, пара k-однородных стратегий , , таких, что ( , ) представляет собой <math>\epsilon \, </math>-равновесие Нэша. | ||
В результате этого получаем квазиполиномиальный алгоритм сложности (nO(ln n)) для вычисления приближенного равновесия. Более того, как было отмечено в [1], ни один алгоритм, исследующий поддержку менее чем за время ln n, не может достичь лучшего приближения, чем 1/4. | В результате этого получаем квазиполиномиальный алгоритм сложности (nO(ln n)) для вычисления приближенного равновесия. Более того, как было отмечено в [1], ни один алгоритм, исследующий поддержку менее чем за время ln n, не может достичь лучшего приближения, чем 1/4. | ||
Строка 40: | Строка 40: | ||
Теорема 2 ([4]) Задача вычисления 1/n(1)-равновесия Нэша для биматричной игры с матрицами n × n является PPAD-полной. | Теорема 2 ([4]) Задача вычисления 1/n(1)-равновесия Нэша для биматричной игры с матрицами n × n является PPAD-полной. | ||
Теорема 2 утверждает, что за исключением случаев, когда PPAD P, не существует схемы аппроксимации с полностью полиномиальным временем исполнения для вычисления равновесия в биматричных играх. Однако это не исключает существования схемы аппроксимации с полиномиальным временем для вычисления | Теорема 2 утверждает, что за исключением случаев, когда PPAD P, не существует схемы аппроксимации с полностью полиномиальным временем исполнения для вычисления равновесия в биматричных играх. Однако это не исключает существования схемы аппроксимации с полиномиальным временем для вычисления <math>\epsilon \, </math>-равновесия Нэша, где <math>\epsilon \, </math> является абсолютной константой, и даже в случае <math>\epsilon \, </math> = (1/poly(ln n)). Более того, как было замечено в [4], если бы задача нахождения <math>\epsilon \, </math>-равновесия Нэша была PPAD-полной в случае, когда <math>\epsilon \, </math> является абсолютной константой, то, согласно Теореме 1, все PPAD-полные задачи были бы разрешимы за квазиполиномиальное время, что едва ли соответствует истине. | ||
Две независимых последовательных работы [6] и [10] впервые продемонстрировали прогресс в нахождении | |||
Две независимых последовательных работы [6] и [10] впервые продемонстрировали прогресс в нахождении <math>\epsilon \, </math>-равновесия Нэша и <math>\epsilon \, </math>-поддерживаемого равновесия Нэша для биматричных игр и некоторого константного 0 < <math>\epsilon \, </math> < 1. В частности, в работе Контогианниса, Панагопулу и Спиракиса [10] был предложен простой линейный алгоритм для вычисления 3/4-равновесия Нэша для любой биматричной игры: | |||
Теорема 3 ([10]) Рассмотрим любую биматричную игру Г = A, B с матрицами n × m; пусть ai1,j1 = maxi,j aij и bi2,j2 = maxi,j bij. Тогда пара стратегий ( , ), где i1 = i2 = j1 = j2 = ½, является 3/4-равновесием Нэша для игры Г. | Теорема 3 ([10]) Рассмотрим любую биматричную игру Г = A, B с матрицами n × m; пусть ai1,j1 = maxi,j aij и bi2,j2 = maxi,j bij. Тогда пара стратегий ( , ), где i1 = i2 = j1 = j2 = ½, является 3/4-равновесием Нэша для игры Г. | ||
Строка 55: | Строка 56: | ||
В источнике [7] представлена полиномиальная конструкция (на базе линейного программирования) 0.38-равновесия Нэша. | В источнике [7] представлена полиномиальная конструкция (на базе линейного программирования) 0.38-равновесия Нэша. | ||
Используя более строгий подход к приближенному вычислению поддерживаемого равновесия Нэша, Даскалакис, Мета и Пападимитриу [6] предложили алгоритм, который, при выполнении весьма интересных и правдоподобных теоретико-графовых предположений, строит 5/6-поддерживаемое равновесие Нэша за полиномиальное время. Однако статус истинности этих умозаключений до сих пор неясен. В работе [6] также было показано, как преобразовать [0, 1]-биматричную игру в {0, 1}-биматричную игру того же размера, в силу чего любое | Используя более строгий подход к приближенному вычислению поддерживаемого равновесия Нэша, Даскалакис, Мета и Пападимитриу [6] предложили алгоритм, который, при выполнении весьма интересных и правдоподобных теоретико-графовых предположений, строит 5/6-поддерживаемое равновесие Нэша за полиномиальное время. Однако статус истинности этих умозаключений до сих пор неясен. В работе [6] также было показано, как преобразовать [0, 1]-биматричную игру в {0, 1}-биматричную игру того же размера, в силу чего любое <math>\epsilon \, </math>-поддерживаемое равновесие Нэша получившейся игры является (1 + <math>\epsilon \, </math>)/2-поддерживаемым равновесием Нэша исходной игры. | ||
В работе Контогианниса и Спиракиса [11] приведен полиномиальный алгоритм вычисления 1/2-поддерживаемого равновесия Нэша для произвольных игр с выигравшими и проигравшими. В основе алгоритма лежит идея равномерного разделения величины отклонения от игры с нулевой суммой между двумя игроками и последующего решения получившейся игры с нулевой суммой за полиномиальное время, используя ее прямое сходство с алгоритмами линейного программирования. Доказано, что полученное равновесие Нэша для игры с нулевой суммой является 1/2-поддерживаемым равновесием Нэша для исходной игры с выигравшими и проигравшими. Таким образом, верна | В работе Контогианниса и Спиракиса [11] приведен полиномиальный алгоритм вычисления 1/2-поддерживаемого равновесия Нэша для произвольных игр с выигравшими и проигравшими. В основе алгоритма лежит идея равномерного разделения величины отклонения от игры с нулевой суммой между двумя игроками и последующего решения получившейся игры с нулевой суммой за полиномиальное время, используя ее прямое сходство с алгоритмами линейного программирования. Доказано, что полученное равновесие Нэша для игры с нулевой суммой является 1/2-поддерживаемым равновесием Нэша для исходной игры с выигравшими и проигравшими. Таким образом, верна | ||
Строка 64: | Строка 65: | ||
Теорема 7 ([11]) Для любых биматричных игр возможно построить (√11/2 - l)-поддерживаемое равновесие Нэша за полиномиальное время. | Теорема 7 ([11]) Для любых биматричных игр возможно построить (√11/2 - l)-поддерживаемое равновесие Нэша за полиномиальное время. | ||
Два недавних результата улучшили статус приближения | Два недавних результата улучшили статус приближения <math>\epsilon \, </math>-равновесия Нэша: | ||
Теорема 8 ([2]) Существует алгоритм с полиномиальным временем, основанный на алгоритмах линейного программирования, который строит 0.36392-равновесие Нэша. | Теорема 8 ([2]) Существует алгоритм с полиномиальным временем, основанный на алгоритмах линейного программирования, который строит 0.36392-равновесие Нэша. | ||
Строка 72: | Строка 73: | ||
Теорема 9 ([17]) Существует алгоритм с полиномиальным временем, основанный на нахождении неподвижных точек в естественной задаче оптимизации, который строит 0.3393-равновесие Нэша. | Теорема 9 ([17]) Существует алгоритм с полиномиальным временем, основанный на нахождении неподвижных точек в естественной задаче оптимизации, который строит 0.3393-равновесие Нэша. | ||
Каннан и Теобальд [9] исследовали иерархию биматричных задач hA, Bi, получаемую из ограничения ранга матрицы A + B до фиксированного ранга, не превышающего k. Они предложили новую модель | Каннан и Теобальд [9] исследовали иерархию биматричных задач hA, Bi, получаемую из ограничения ранга матрицы A + B до фиксированного ранга, не превышающего k. Они предложили новую модель <math>\epsilon \, </math>-аппроксимации для игр ранга k и, используя результаты квадратичной оптимизации, показали, что приближенные равновесия Нэша для игр с константным рангом могут быть вычислены детерминированным образом за время, полиномиальное относительно 1/<math>\epsilon \, </math>. Кроме того, в [9] представлен рандомизированный алгоритм приближения для определенных задач квадратичной оптимизации, что позволяет создать рандомизированный алгоритм приближения для задачи нахождения равновесия Нэша. Этот рандомизированный алгоритм имеет практически ту же временную сложность, что и детерминированный, однако при условии истинности предположения позволяет найти точное решение за полиномиальное время. Наконец, эти же авторы предложили алгоритм с полиномиальным временем для относительного приближения (касающегося выигрышей при равновесии) для случая, когда матрица A + B имеет неотрицательную декомпозицию. | ||
== Применение == | == Применение == |
правок