4846
правок
KVN (обсуждение | вклад) |
Irina (обсуждение | вклад) |
||
| Строка 3: | Строка 3: | ||
== Постановка задачи == | == Постановка задачи == | ||
Эта | Эта задача связана с эффективным проектированием бессерверной инфраструктуры для объединения (федерации) хостов для хранения, индексирования и поиска информации, а также для эффективного распространения данных между хостами. Ключевыми сервисами одноранговых (P2P) оверлейных сетей являются следующие: | ||
1. Протокол поиска с ключом позволяет найти информацию на сервере или серверах, где она хранится. | 1. Протокол поиска с ключом позволяет найти информацию на сервере или серверах, где она хранится. | ||
| Строка 15: | Строка 15: | ||
Наиболее влиятельным механизмом в этой области является '' | Наиболее влиятельным механизмом в этой области является ''согласованное хэширование'', впервые примененное в работе Каргера и др. [21]. Идея приблизительно заключается в следующем. Часто хорошим способом организации каталога поиска является хэш-таблица, обеспечивающая быстрый доступ к данным со сложностью O(1). Для масштабирования и обеспечения высокой доступности сервисов поиска мы разбиваем хэш-таблицу на части и назначаем разные части разным серверам. Например, если в хэш-таблице есть записи от 1 до <math>n</math>, а в системе поиска участвуют <math>k</math> серверов, мы можем дать возможность каждому серверу выбрать виртуальный идентификатор от 1 до <math>n</math> случайным образом. Тогда сервер <math>i</math> будет отвечать за значения ключей, которые ближе к <math>i</math>, чем к идентификатору любого другого сервера. При хорошей рандомизации хэш-ключей мы можем получить более или менее сбалансированное распределение информации между нашими <math>k</math> серверами. Ожидается, что каждый сервер будет отвечать за <math>(n/k)</math> ключей. Кроме того, отключение или подключение сервера затрагивает только один или два других сервера с соседними виртуальными идентификаторами. | ||
Сеть серверов, реализующих | Сеть серверов, реализующих согласованное хэширование, называется ''распределенной хэш-таблицей'' (DHT). Многие современные сети совместного использования ресурсов и практически все академические исследовательские проекты в этой области построены на идее DHT. | ||
правок