Аноним

Обучение, эффективное с точки зрения атрибутов: различия между версиями

Материал из WEGA
(Новая страница: «== Ключевые слова и синонимы == Обучение с нерелевантными атрибутами == Постановка задачи…»)
 
Строка 3: Строка 3:


== Постановка задачи ==
== Постановка задачи ==
Здесь приводится базовая формулировка, использующая онлайновую модель с ограниченной ошибкой, которая была использована Литтлстоуном [ ] в его основополагающей работе.
Здесь приводится базовая формулировка, использующая онлайновую модель с ограниченной ошибкой, которая была использована Литтлстоуном [9] в его основополагающей работе.




Зафиксируем класс C булевых функций над n переменными. Для запуска сценария обучения выбирается целевая функция /* 2 C, однако она не раскрывается алгоритму обучения. Затем выполняется обучение, состоящее из последовательности попыток. В ходе попытки t алгоритму обучения подаются на вход данные xt2f0;1gn. После этого алгоритм обучения выдает свой прогноз yt, который является его предположением о неизвестном значении f*(xt). Затем ученику раскрывается правильное значение yt = /* (xt). Если ф yt, то алгоритм обучения допустил ошибку. Мы говорим, что алгоритм обучения изучает C с ошибкой, ограниченной m, если количество ошибок никогда не превышает m независимо от того, сколько попыток было сделано и как были выбраны /* и x1, x2.
Зафиксируем класс C булевых функций над n переменными. Для запуска сценария обучения выбирается ''целевая функция'' <math>f_* \in C</math>, однако она не раскрывается ''алгоритму обучения''. Затем выполняется обучение, состоящее из последовательности ''попыток''. В ходе попытки t алгоритму обучения подаются на вход данные <math>x_t \in \{ 0, 1 \}^n</math>. После этого алгоритм обучения выдает свой ''прогноз'' <math>\hat{y}_t</math>, который является его предположением о неизвестном значении <math>f_* (x_t)</math>. Затем ученику раскрывается правильное значение <math>y_t = f_* (x_t)</math>. Если <math>y_t \ne \hat{y}_t</math>, то алгоритм обучения допустил ''ошибку''. Мы говорим, что алгоритм обучения изучает C с ошибкой, ограниченной m, если количество ошибок никогда не превышает m независимо от того, сколько попыток было сделано и как были выбраны <math>f_*</math> и <math>x_1, x_2, ...</math>.




Переменная (или атрибут) Xi релевантна для функции /: {0,1}" ^ {0,1}, если /(xi, ,*,■,*„) ф f(x 1 ; 1 — x i ; xn) выполняется для некоторого x € 0;1n. Предположим теперь, что для некоторых значений k < n каждая функция f 2 C имеет не более k релевантных переменных. Утверждается, что алгоритм обучения изучает класс C эффективно с точки зрения атрибута, если он изучает C с ошибкой, ограниченной полиномом от k и log n. Кроме того, как правило, требуется, чтобы время вычисления для каждой попытки было полиномом от n.
Переменная (или атрибут) Xi ''релевантна'' для функции /: {0,1}" ^ {0,1}, если /(xi, ,*,■,*„) ф f(x 1 ; 1 — x i ; xn) выполняется для некоторого x € 0;1n. Предположим теперь, что для некоторых значений k < n каждая функция f 2 C имеет не более k релевантных переменных. Утверждается, что алгоритм обучения изучает класс C эффективно с точки зрения атрибута, если он изучает C с ошибкой, ограниченной полиномом от k и log n. Кроме того, как правило, требуется, чтобы время вычисления для каждой попытки было полиномом от n.


==Основные результаты ==
==Основные результаты ==
4551

правка