Независимые множества в случайных графах пересечений: различия между версиями

Перейти к навигации Перейти к поиску
 
(не показано 16 промежуточных версий 1 участника)
Строка 1: Строка 1:
== Ключевые слова и синонимы ==
== Ключевые слова и синонимы ==
Существование и эффективное построение независимых множеств вершин в случайных графах пересечений
Существование и эффективное построение независимых множеств вершин в случайных графах пересечений общего вида


== Постановка задачи ==
== Постановка задачи ==
Строка 6: Строка 6:




'''Определение 1 (равномерные случайные графы пересечений)'''. Рассмотрим совокупность элементов <math>M = \{1, 2, ..., m \}</math> и множество вершин <math>V = \{ v_1, v_2, ..., v_n \} </math>. Если каждой вершине <math>v_j, j = 1, 2, ..., n</math> независимым образом присвоить подмножество <math>S_{v_j}</math> множества M посредством независимого выбора каждого элемента с вероятностью p и проложить ребро между двумя вершинами <math>v_{j_1}, v_{j_2}</math> в том и только том случае, если <math>S_{v_{j_1}} \cap S_{v_{j_2}} \ne \empty </math>, то полученный граф будет представлять собой экземпляр равномерных случайных графов пересечений <math>G_{n,m,p} \;</math>.
'''Определение 1 (равномерный случайный граф пересечений)'''. Рассмотрим совокупность элементов <math>M = \{1, 2, ..., m \}</math> и множество вершин <math>V = \{ v_1, v_2, ..., v_n \} </math>. Если каждой вершине <math>v_j, j = 1, 2, ..., n</math> независимым образом присвоить подмножество <math>S_{v_j}</math> множества M посредством независимого выбора каждого элемента с вероятностью p и проложить ребро между двумя вершинами <math>v_{j_1}, v_{j_2}</math> в том и только том случае, если <math>S_{v_{j_1}} \cap S_{v_{j_2}} \ne \empty </math>, то полученный граф будет представлять собой экземпляр равномерных случайных графов пересечений <math>G_{n,m,p} \;</math>.




Совокупность M иногда называется ''множеством меток'', а ее элементы – ''метками''. Обозначим за <math>L_l</math> для <math>l \in M</math> множество вершин, выбравших метку l.
Совокупность M иногда называется ''множеством меток'', а ее элементы – ''метками''. Обозначим за <math>L_l</math> для <math>l \in M</math> множество вершин, выбравших метку ''l''.




В силу зависимостей от ребер эта модель способна более точно (по сравнению с моделью случайных графов Бернулли <math>G_{n,p}</math>, предполагающей независимость от ребер) абстрагировать многие практические задачи. Кроме того, Филл, Шайнерманн и Сингер-Коэн в работе [3] показали, что для некоторых диапазонов параметров <math>n, m, p (m = n^{\alpha}, \alpha > 6)</math> пространства <math>G_{n, m, p}</math> и <math>G_{n, \hat{p}}</math> являются эквивалентными в том смысле, что суммарное вариационное расстояние между переменными случайного графа имеет предел, равный 0. Николетсис, Раптопулос и Спиракис [7] предложили две новых модели, а именно модель ''случайных графов пересечений общего вида'' <math>G_{n, m,\overrightarrow{p}}, \overrightarrow{p} = [p_1, p_2, ..., p_m]</math> и модель ''регулярных случайных графов пересечений'' <math>G_{n, m, \lambda}, \lambda > 0</math>, использующих различные способы случайного присвоения меток вершинам, но применяющих одно и то же правило вхождения ребер. Модель <math>G_{n, m,\overrightarrow{p}}</math> является обобщением равномерной модели, в котором каждая метка <math>i \in M</math> выбирается независимо с вероятностью <math>p_i</math>, тогда как в модели <math>G_{n, m, \lambda}</math> каждая вершина выбирает случайное подмножество M, содержащее в точности <math>\lambda</math> меток.
В силу зависимостей от ребер эта модель способна более точно (по сравнению с моделью случайных графов Бернулли <math>G_{n,p}</math>, предполагающей независимость от ребер) абстрагировать многие практические задачи. Кроме того, Филл, Шайнерманн и Сингер-Коэн в работе [3] показали, что для некоторых диапазонов параметров <math>n, m, p \; (m = n^{\alpha}, \alpha > 6)</math> пространства <math>G_{n, m, p}</math> и <math>G_{n, \hat{p}}</math> являются эквивалентными в том смысле, что суммарное вариационное расстояние между случайными переменными графа имеет предел, равный 0. Николетсис, Раптопулос и Спиракис [7] предложили две новых модели, а именно модель ''случайных графов пересечений общего вида'' <math>G_{n, m,\overrightarrow{p}}, \overrightarrow{p} = [p_1, p_2, ..., p_m]</math> и модель ''регулярных случайных графов пересечений'' <math>G_{n, m, \lambda}, \lambda > 0</math>, использующих различные способы случайного присвоения меток вершинам, но применяющих одно и то же правило построения ребер. Модель <math>G_{n, m,\overrightarrow{p}}</math> является обобщением равномерной модели, в котором каждая метка <math>i \in M</math> выбирается независимо с вероятностью <math>p_i</math>, тогда как в модели <math>G_{n, m, \lambda}</math> каждая вершина выбирает случайное подмножество M, содержащее в точности <math>\lambda</math> меток.




Строка 18: Строка 18:


== Основные результаты ==
== Основные результаты ==
Следующие теоремы рассматривают существование независимых множеств вершин мощности k в случайных графах пересечений. Доказательство теоремы 1 использует факт линейности математического ожидания суммы случайных переменных.
Следующие теоремы рассматривают существование независимых множеств вершин мощности k в случайных графах пересечений общего вида. Доказательство теоремы 1 использует факт линейности математического ожидания суммы случайных переменных.




Теорема 1. Обозначим за X(k) число независимых множеств размера k в случайном графе пересечений <math>G_{n,m,p} \;</math>, где p = [p1; p2; pm]. Тогда m
'''Теорема 1. Обозначим за <math>X^{(k)}</math> число независимых множеств размера k в случайном графе пересечений <math>G(n, m,\overrightarrow{p})</math>, где <math>\overrightarrow{p} = [p_1, p_2, ..., p_m]</math>. Тогда'''


<math>E \Big[ X^{(k)} \Big] = \binom{n}{k} \prod_{i=1}^m \Big( (1 - p_i)^k + kp_i (1 - p_i)^{k - 1} \Big).</math>


Теорема 2. Обозначим за X(k) число независимых множеств размера k в случайном графе пересечений G(n; m;pE), где p = [p1; p2; pm]. Тогда -<*»)= , где E [X^] – среднее число независимых множеств размера k, а m Y(k, s)= }~


'''Теорема 2. Обозначим за <math>X^{(k)}</math> число независимых множеств размера k в случайном графе пересечений <math>G(n, m,\overrightarrow{p})</math>, где <math>\overrightarrow{p} = [p_1, p_2, ..., p_m]</math>. Тогда'''


Для доказательства теоремы 2 вначале запишем дисперсию в виде суммы ковариаций, а затем применим технику сжатия вершин, выполняющую слияние нескольких вершин в одну супер-вершину со схожим вероятностным поведением, для вычисления ковариаций. При помощи метода моментов второго порядка (см. [ 1 ]) можно вычислить порог для существования независимых множеств размера.
<math>Var \big( X^{(k)} \big) = \sum_{s=1}^k \binom{n}{2k - s} \binom{2k - s}{s} \Big( \gamma(k, s) \frac{E[x^{(k)}]}{\binom{n}{k}} - \frac{E^2 [X^{(k)}]}{\binom{n}{k}^2} \Big)</math>,


'''где <math>E[X^{(k)}]</math> – среднее число независимых множеств размера k,'''


Один из трех предложенных в работе [ ] алгоритмов приведен далее. Алгоритм начинает работу с V (т. е. множества всех вершин графа) в качестве «кандидата» на роль независимого множества. На каждом последующем шаге он выбирает метку и удаляет из текущего кандидата на роль независимого множества все вершины, содержащие эту метку в назначенном им множестве меток, кроме одной. В силу правила вхождения ребер этот подход гарантирует, что после выполнения этой операции для всех меток множества M финальный кандидат на роль независимого множества будет содержать только вершины, не имеющие ребер между ними, и потому по определению будет являться независимым множеством.
'''а <math>\gamma(k, s) = \prod_{i=1}^m \Big( (1 - p_i)^{k - s} + (k - s)p_i (1 - p_i)^{k - s - 1} \Big( 1 - \frac{sp_i}{1 + (k - 1) p_i} \Big) \Big).</math>'''




Алгоритм:
Для доказательства теоремы 2 вначале запишем дисперсию в виде суммы ковариаций, а затем применим технику сжатия вершин, выполняющую слияние нескольких вершин в одну супер-вершину со схожим вероятностным поведением, для вычисления ковариаций. При помощи метода моментов второго порядка [1] можно вычислить порог для существования независимых множеств размера k.


Дано: случайный граф пересечений <math>G_{n,m,p} \;</math>.


Требуется: найти независимое множество вершин Am.
Один из трех предложенных в работе [7] алгоритмов приведен далее. Алгоритм начинает работу с V (т. е. множества всех вершин графа) в качестве «кандидата» на роль независимого множества. На каждом последующем шаге он выбирает метку и удаляет из текущего кандидата на роль независимого множества все вершины, содержащие эту метку в назначенном им множестве меток, кроме одной. В силу правила построения ребер этот подход гарантирует, что после выполнения данной операции для всех меток множества M финальный кандидат на роль независимого множества будет содержать только вершины, не имеющие ребер между ними, и потому по определению будет являться независимым множеством.


  1. положить A0 := V; положить L := M;
  2. for i: = 1 to m do
  3. begin
  4. выбрать случайную метку li 2 L; положить L := L - lig;
  5. положить Di := fv 2 A,-_i : li 2 Svg;
  6. if(|D,| > 1) then выбрать случайную вершину u 2 Di и положить Di := Di -{M};
  7. положить Ai := A,-_i D i;
  8. end
  9. output Am;


'''Алгоритм:'''


Следующая теорема рассматривает мощность независимого множества, вычисляемого алгоритмом. При анализе алгоритма используются уравнение Вальда (см. [ ]) для сумм случайного количества случайных переменных, позволяющее вычислить среднее значение jAmj, и границы Чернова (см, например, [6]) для концентрации вокруг среднего значения.
Дано: случайный граф пересечений <math>G_{n,m,p}</math>.


Требуется: найти независимое множество вершин <math>A_m</math>.


Теорема 3. Для случая mp = a log n для некоторой константы a > 1, m > n и некоторой константы ji > 0 с высокой вероятностью выполняются следующие утверждения:
  1. положить <math>A_0 := V</math>; положить L := M;
  2. '''for''' i: = 1 '''to''' m '''do'''
  3. '''begin'''
  4.   выбрать случайную метку <math>l_i \in L</math>; положить <math>L := L - \{ l_i \}</math>;
  5.   положить <math>D_i := \{ v \in A_{i - 1} : l_i \in S_v \}</math>;
  6.   '''if''' <math>(|D_i| \ge 1)</math> '''then''' выбрать случайную вершину <math>u \in D_i</math> и положить <math>D_i := D_i - \{ u \}</math>;
  7.   положить <math>A_i := A_{i - 1} - D_i</math>;
  8. '''end'''
  9. '''output''' <math>A_m</math>;


1. Если np  1 то jAmj > (1 - P)^.


2. Если np  b, где b > 0 – константа, то jAm  - e~b).
Следующая теорема рассматривает мощность независимого множества, вычисляемого алгоритмом. При анализе алгоритма используются уравнение Вальда [9] для сумм случайного количества случайных переменных, позволяющее вычислить среднее значение <math>|A_m|</math>, и границы Чернова (см, например, [6]) для вычисления концентрации вокруг среднего значения.


3. Если np 0 то jAmj > (1 - $)n.
 
'''Теорема 3. Для случая <math>mp = \alpha \; log \; n</math> для некоторой константы <math>\alpha > 1, m \ge n</math> и некоторой константы <math>\beta > 0</math> с высокой вероятностью выполняются следующие утверждения:'''
 
'''1. Если <math>np \to \infty</math>, то <math>|A_m| \ge (1 - \beta) \frac{n}{log \; n}</math>.'''
 
'''2. Если <math>np \to b</math>, где b > 0 – константа, то <math>|A_m| \ge (1 - \beta) n (1 - e^{-b})</math>.'''
 
'''3. Если <math>np \to 0</math>, то <math>|A_m| \ge (1 - \beta) n</math>.'''




Строка 65: Строка 73:


== Применение ==
== Применение ==
Прежде всего отметим, что, как доказано в работе [ ], любой граф может быть преобразован в граф пересечений. Таким образом, модели случайных графов пересечений могут быть очень обобщенными. Кроме того, для некоторых диапазонов параметров n; m; p (m = na,a > 6) пространства <math>G_{n,m,p} \;</math> и <math>G_{n,p} \;</math> эквивалентны (что было доказано Филлом, Шайнерманом и Сингер-Коэн в работе [3], которые показали, что в этом диапазоне суммарное вариационное расстояние между переменными случайного графа имеет предел, равный 0).
Прежде всего отметим, что, как доказано в работе [5], любой граф может быть преобразован в граф пересечений. Таким образом, модели случайных графов пересечений могут быть очень обобщенными. Кроме того, для некоторых диапазонов параметров <math>n, m, p \; (m = n^{\alpha}, \alpha > 6)</math> пространства <math>G_{n,m,p}</math> и <math>G_{n,p}</math> эквивалентны (что было доказано Филлом, Шайнерманом и Сингер-Коэн в работе [3], показавшими, что в этом диапазоне суммарное вариационное расстояние между случайными переменными графа имеет предел, равный 0).




Строка 71: Строка 79:


== Родственные работы ==
== Родственные работы ==
В своей работе [4] Каронски и коллеги рассматривают задачу возникновения графов с константным числом вершин как порожденных подграфов графов <math>G_{n,m,p} \;</math>. Заметив, что модель <math>G_{n,m,p} \;</math> генерирует графики при помощи кликовых покрытий (например, множества Ll;l 2 M представляют собой очевидное кликовое покрытие), они вывели естественный способ их использования совместно с методами моментов первого и второго порядков для нахождения, чтобы определить пороговые значения для появления любого фиксированного графа H как порожденного подграфа <math>G_{n,m,p} \;</math> для различных значений параметров n, m и p.
В своей работе [4] Каронски и коллеги рассматривают задачу возникновения графов с константным числом вершин как порожденных подграфов графов <math>G_{n,m,p}</math>. Заметив, что модель <math>G_{n,m,p}</math> генерирует графы при помощи кликовых покрытий (например, множества <math>L_l, l \in M</math>, представляют собой очевидное кликовое покрытие), они вывели естественный способ их использования совместно с методами моментов первого и второго порядков для того, чтобы определить пороговые значения для появления любого фиксированного графа H как порожденного подграфа <math>G_{n,m,p}</math> для различных значений параметров n, m и p.




Порог связности для <math>G_{n,m,p} \;</math> Карен Сингер-Коэн рассматривала в работе [10]. Она изучала случай m = na,a > 0, различая два случая в соответствии со значением a. Для случая a > 1 результаты выглядят похожими на графы <math>G_n</math>, так как среднее число ребер на порогах связности оказывается (приблизительно) одинаковым. С другой стороны, при a < 1 мы получаем более плотные графы в <math>G_{n,m,p} \;</math>. Помимо связности, в [10] также рассматривался размер наибольшей клики в равномерных случайных графах пересечений для определенных значений n, m и p.
Порог связности для <math>G_{n,m,p}</math> Карен Сингер-Коэн рассматривала в работе [10]. Она изучала случай <math>m = n^{\alpha}, \alpha > 0</math>, различая два случая в соответствии со значением <math>\alpha</math>. Для случая <math>\alpha > 1</math> результаты выглядят похожими на графы <math>G_{n, p}</math>, так как среднее число ребер на порогах связности оказывается (приблизительно) одинаковым. С другой стороны, при <math>\alpha \le 1</math> мы получаем более плотные графы в модели <math>G_{n,m,p}</math>. Помимо связности, в [10] также рассматривался размер наибольшей клики в равномерных случайных графах пересечений для определенных значений n, m и p.




Эфтимиу и Спиракис [ ] рассматривали существование гамильтоновых циклов в графах <math>G_{n,m,p}</math>. Используя соображения о связи, авторы показали, что порог возникновения гамильтоновых циклов достаточно близок к порогу связности <math>G_{n,m,p}</math>. Эффективные вероятностные алгоритмы нахождения гамильтоновых циклов в в равномерных случайных графах пересечений представили Раптопулос и Спиракис в работе [8]. Анализ этих алгоритмов подтверждает, что они хорошо работают с высокой вероятностью даже при значениях p, близких к порогу связности <math>G_{n,m,p}</math>. Кроме того, в той же работе предложен алгоритм нахождения гамильтоновых циклов графах в <math>G_{n,m,p}</math> с константой p с ожидаемым полиномиальным временем выполнения.
Эфтимиу и Спиракис [2] рассматривали существование гамильтоновых циклов в графах <math>G_{n,m,p}</math>. Используя соображения о связи, авторы показали, что порог возникновения гамильтоновых циклов достаточно близок к порогу связности <math>G_{n,m,p}</math>. Эффективные вероятностные алгоритмы нахождения гамильтоновых циклов в равномерных случайных графах пересечений представили Раптопулос и Спиракис в работе [8]. Анализ этих алгоритмов подтверждает, что они хорошо работают с высокой вероятностью даже при значениях p, близких к порогу связности <math>G_{n,m,p}</math>. Кроме того, в той же работе был предложен алгоритм нахождения гамильтоновых циклов графах в <math>G_{n,m,p}</math> с константой p с ожидаемым полиномиальным временем выполнения.




В [11] Старк представил аппроксимацию распределения степени фиксированной вершины в модели <math>G_{n,m,p}</math>. Точнее говоря, применяя метод решета, автор предлагает точную формулу для производящей функции вероятности, генерирующей степень некоторой фиксированной вершины, а затем анализирует эту формулу для различных значений параметров n, m и p.
В [11] Старк представил аппроксимацию распределения степени фиксированной вершины в модели <math>G_{n,m,p}</math>. Точнее говоря, применяя метод решета, автор предлагает точную формулу для производящей функции вероятности от степени некоторой фиксированной вершины, а затем анализирует эту формулу для различных значений параметров n, m и p.


== Открытые вопросы ==
== Открытые вопросы ==
Некоторые задачи, имеющие отношение к случайным графам пересечений, остаются нерешенными. Почти все предложенные до сих пор алгоритмы построения больших независимых множеств и нахождения гамильтоновых циклов в случайных графах пересечений, являются жадными. Интересным и важным направлением исследований заключается в нахождении более проработанных алгоритмов для этих задач, превосходящих эффективностью жадные. Кроме того, все эти алгоритмы были представлены и проанализированы в модели равномерных случайных графов пересечений. Очень мало известно о том, как эти же алгоритмы будут работать, получив на входе экземпляр общей или даже регулярной модели случайных графов пересечений.
Некоторые задачи, имеющие отношение к случайным графам пересечений, остаются нерешенными. Почти все предложенные до сих пор алгоритмы построения больших независимых множеств и нахождения гамильтоновых циклов в случайных графах пересечений являются жадными. Интересное и важное направление исследований заключается в нахождении более проработанных алгоритмов для этих задач, превосходящих эффективностью жадные. Кроме того, все эти алгоритмы были представлены и проанализированы в модели равномерных случайных графов пересечений. Очень мало известно о том, как эти же алгоритмы будут работать, получив на входе экземпляр общей или даже регулярной модели случайных графов пересечений.




Строка 89: Строка 97:




Наконец, отметим, что ни один из результатов, представленных в библиографии для общих или равномерных случайных графов пересечений, нельзя сходу перенести на регулярные случайные графы пересечений. Разумеется, для некоторых значений n, m, p и A определенные свойства графов, показанные для <math>G_{n,m,p}</math>, можно доказать и для С "тд, продемонстрировав концентрацию числа меток, выбранных любой вершиной с помощью границ Чернова. Кроме того, фиксированные размеры множеств, назначенных каждой вершине, накладывают на модель дополнительные зависимости.
Наконец, отметим, что ни один из результатов, представленных в библиографии для общих или равномерных случайных графов пересечений, нельзя сходу перенести на регулярные случайные графы пересечений. Разумеется, для некоторых значений n, m, p и <math>\lambda</math> определенные свойства графов, показанные для <math>G_{n,m,p}</math>, можно доказать и для <math>G_{n,m,\lambda}</math>, продемонстрировав концентрацию числа меток, выбранных любой вершиной с помощью границ Чернова. Кроме того, фиксированные размеры множеств, назначенных каждой вершине, накладывают на модель дополнительные зависимости.


== См. также ==
== См. также ==
Строка 116: Строка 124:


11. Stark, D.: The vertex degree distribution of random intersection graphs. Random Struct. Algorithms 24, 249-258 (2004)
11. Stark, D.: The vertex degree distribution of random intersection graphs. Random Struct. Algorithms 24, 249-258 (2004)
[[Категория: Совместное определение связанных терминов]]

Навигация