Миграция данных: различия между версиями
Irina (обсуждение | вклад) |
Irina (обсуждение | вклад) |
||
Строка 57: | Строка 57: | ||
1. '''Миграция в <math>R_i \;</math>''': каждый элемент данных вначале отправляется в множество <math>R_i \;</math>. Преобразуя дробное решение, приведенное в L(M), можно найти график миграции из <math>s_i \;</math> в <math>R_i \;</math>, требующий не более <math>2M + \alpha \;</math> раундов. | 1. '''Миграция в <math>R_i \;</math>''': каждый элемент данных вначале отправляется в множество <math>R_i \;</math>. Преобразуя дробное решение, приведенное в L(M), можно найти график миграции из <math>s_i \;</math> в <math>R_i \;</math>, требующий не более <math>2M + \alpha \;</math> раундов. | ||
2. Миграция в | 2. '''Миграция в <math>r_i \;</math>:''' элемент i отправляется из первичного источника <math>s_i \;</math> в <math>r_i \;</math>. Эту миграцию можно выполнить за <math>1,5 \alpha \;</math> раундов при помощи раскраски ребер [16]. | ||
3. Миграция на оставшиеся диски: Теперь можно создать граф переноса из представителей на оставшиеся диски следующим образом. Для каждого элемента i добавьте ориентированные ребра от дисков в Ri к ф - 1) |_^J дискам в D \ Rt, такие, что полустепень выхода каждой вершины в Ri не превышает f$ — 1, а полустепень входа каждой вершины в Д \ Ri из Ri равна 1. Также добавляется ориентированное ребро от вторичного представителя ri элемента i к оставшимся дискам в D, не имеющим входящих ребер из Ri. Было показано, что максимальная степень графа переносов не превышает 4/3 – 5, а кратность равна f$ + 2. Следовательно, миграцию из графа переносов можно выполнить за 5f$ - 3 раундов при помощи алгоритма раскраски ребер мультиграфа [18]. | 3. '''Миграция на оставшиеся диски:''' Теперь можно создать граф переноса из представителей на оставшиеся диски следующим образом. Для каждого элемента i добавьте ориентированные ребра от дисков в Ri к ф - 1) |_^J дискам в D \ Rt, такие, что полустепень выхода каждой вершины в Ri не превышает f$ — 1, а полустепень входа каждой вершины в Д \ Ri из Ri равна 1. Также добавляется ориентированное ребро от вторичного представителя ri элемента i к оставшимся дискам в D, не имеющим входящих ребер из Ri. Было показано, что максимальная степень графа переносов не превышает 4/3 – 5, а кратность равна f$ + 2. Следовательно, миграцию из графа переносов можно выполнить за 5f$ - 3 раундов при помощи алгоритма раскраски ребер мультиграфа [18]. | ||
Версия от 12:11, 6 сентября 2017
Ключевые слова и синонимы
Перенос файлов; перемещение данных
Постановка задачи
Задача обусловлена необходимостью управления данными, хранящимися на множестве устройств, для обработки динамически меняющихся потребностей. Чтобы обеспечить максимально эффективное использование данных, их расположение (т.е. отображение, определяющее местонахождение подмножеств элементов данных на каждом диске) необходимо вычислять с учетом емкостей дисков и потребностей в данных. По мере изменения потребности в данных со временем системе необходимо создавать новое расположение. Задача миграции данных заключается в вычислении эффективного графика для множества дисков, позволяющего преобразовать исходное расположение в целевое.
Рисунок 1. Слева: примеры исходного и целевого расположения данных. Справа: соответствующие множества
Определение задачи выглядит следующим образом. Предположим, что имеется N дисков и
Предположим, что в основе системы лежит полностью связная сеть, а все элементы данных имеют один и тот же размер. Иными словами, перемещение элемента данных с одного диска на другой всегда занимает одно и то же время.
Следовательно, миграция осуществляется в несколько раундов. Рассмотрим полудуплексную модель, в которой каждый диск может участвовать в передаче только одного элемента данных – в качестве отправителя либо получателя. Задача заключается в построении графика миграции с минимальным количеством раундов. Использование обходных вершин не допускается (то есть вершин, не являющихся целью операции перемещения, но используемых как промежуточные точки хранения элемента данных), так что все элементы данных направляются только дискам, которым они требуются.
Основные результаты
Хуллер и др. [11] разработали 9,5-аппроксимацию для задачи миграции данных, коэффициент которой был впоследствии улучшен до 6.5 + o(1). Далее мы рассмотрим нижние границы задачи.
Нотация и нижние границы
1. Максимальная полустепень захода (
2. Максимальное количество элементов, источником или назначением которых может быть диск
3. Минимальное время, необходимое для клонирования (M): Пусть диск j делает копию элемента i в k-м раунде. В конце m-го раунда количество копий, которые могут быть созданы из этой копии, не превышает
L(m):
Алгоритм миграции данных
9,5-аппроксимацию можно получить следующим образом.
Алгоритм вначале вычисляет множества представителей для каждого элемента и отправляет элемент в множество, которое, в свою очередь, пересылает элемент в оставшееся множество. Множества представителей вычисляются по-разному в зависимости от размера
Представители для больших множеств
Для множеств размером не менее
Представители для маленьких множеств
Для каждого элемента i положим
Планирование миграций
Если имеются представители для всех элементов данных, миграцию можно выполнить в три этапа следующим образом:
1. Миграция в
2. Миграция в
3. Миграция на оставшиеся диски: Теперь можно создать граф переноса из представителей на оставшиеся диски следующим образом. Для каждого элемента i добавьте ориентированные ребра от дисков в Ri к ф - 1) |_^J дискам в D \ Rt, такие, что полустепень выхода каждой вершины в Ri не превышает f$ — 1, а полустепень входа каждой вершины в Д \ Ri из Ri равна 1. Также добавляется ориентированное ребро от вторичного представителя ri элемента i к оставшимся дискам в D, не имеющим входящих ребер из Ri. Было показано, что максимальная степень графа переносов не превышает 4/3 – 5, а кратность равна f$ + 2. Следовательно, миграцию из графа переносов можно выполнить за 5f$ - 3 раундов при помощи алгоритма раскраски ребер мультиграфа [18].
Анализ
Заметим, что общее количество раундов, необходимых для выполнения вышеописанного алгоритма, не превышает 2M + 2.5a + 5f$ - 3. Поскольку a, f$ и M являются нижними границами оптимального количества раундов, этот алгоритм дает 9,5-аппроксимацию.
Теорема 1 ([11]). Существует алгоритм 9,5-аппроксимации для задачи миграции данных.
Хуллер и др. [10] позднее улучшили его, получив (6,5 + o(1))-аппроксимацию.
Теорема 2 ([10]). Существует алгоритм (6.5 + o(1))-аппроксимации для задачи миграции данных.
Применение
Миграция данных в системах хранения