ÑÐ¾ÑÐ¼Ð°Ñ Adobe PDF, ÑÐ°Ð·Ð¼ÐµÑ 2173 ÐÐ± - ÐÐ½ÑÐ¾ÑÐ¼Ð°ÑÐ¸Ð¾Ð½Ð½Ð¾ ...

More documents

Recommendations

Info

ISBN 5–7262–0471–9ЛЕКЦИИ ПО НЕЙРОИНФОРМАТИКЕКлассическая схема максимального правдоподобия весьма проста, ноее основным недостатком в многомерном случае являются нулевые оценкивероятностей сочетаний значений переменных, не встретившихся в выборке.Между тем, из-за комбинаторного роста числа таких сочетаний вматрицах условных вероятностей будет все больше нулевых значений, аостальные значения будут сильно зашумлены из-за малого числа отсчетов.В байесовом подходе нулевые значения заменятся априорными вероятностями,которые позволят улучшить оценки прогнозируемых значений, нозато будут нивелированы экспериментальные свидетельства.Таким образом, оба подхода имеют свои недостатки и преимущества,что и дает пищу нескончаемым дискуссиям сторонников классических ибайесовых вероятностей. Практика требует примирения, но в настоящеевремя равновесие, по-видимому, смещено в сторону классического подхода16 .Сложная задача автоматического синтеза топологии связей сети такжеобычно рассматривается на основе и классического, и байесового подходов.После внесения пробного изменения в топологию сети, два структурныхварианта сравниваются путем оценки значения знаменателя формулы Байеса(evidence) или правдоподобия всей совокупности обучающих примеров.Далее архитектуры с лучшими значениями ценности отбираются в соответствиис принятой схемой рандомизированного или детерминированногопоиска.Обсудим здесь упрощенный вариант задачи синтеза топологии вероятностнойсети для случая бинарного дерева, аппроксимирующего распределениеусловной вероятности для нескольких независимых и однойзависимой переменной. Обучение таких регрессионных деревьев можетиспользоваться для сравнительного анализа значимости независимых переменныхпри их отборе для байесовой сетевой модели.Вероятностные деревьяВ этом разделе предлагается (относительно новый) подход последовательногоупрощения задачи аппроксимации условной вероятности, основанныйна вероятностных деревьях [10, 12]. Рассмотрим матрицу эмпирических16 Это — априорная оценка автора, который относит себя, скорее, к сторонникам байесовогоподхода. Классический подход популярен среди физиков [1], байесовы вероятности —среди специалистов по обучению машин и анализу данных (www.auai.org).172 УДК 004.032.26 (06) Нейронные сети
С. А. ТЕРЕХОВданных D, строки которой соответствуют реализациям случайных переменных{ ⃗ X; Y }. Эти данные содержат информацию об условной плотностивероятности p (y | ⃗x). Нашей целью будет построение функциональноймодели этой плотности.Для простоты ограничимся случаем скалярной зависимой переменной17 . Если последняя принимает непрерывный ряд значений на некоторомотрезке, то задача аппроксимации плотности соответствует задаче (нелинейной)регрессии. При этом независимые переменные могут быть какнепрерывными, так и дискретными (упорядоченными или неупорядоченными).При построении модели условной плотности мы будем опираться набайесов подход вывода заключений из данных (reasoning). А именно, имеющуюсяинформацию о значениях входных переменных обученная машинапереводит в апостериорную информацию о характере распределения выходной(зависимой) переменной.Процесс вывода суждения может носить итерационный характер: машинапоследовательно использует информацию, содержащуюся во входахдля построения сужающихся приближений к апостериорной плотности 18 .Вопрос заключается в эффективном способе синтеза (обучения) такойвероятностной машины на основе лишь имеющихся эмпирических данных.Метод построения связей и выбора правил в узлах дереваОстановимся на простой информационной трактовке обучения искомойвероятностной машины. Для этого на множестве значений зависимой переменнойвведем дискретизацию y min < y 1 < . . . < y k < . . . y max такимобразом, что в каждый отрезок попадает одинаковое число наблюденийn k = p k · N 0 из матрицы наблюдений D. Тогда априорная заселенность 19всех интервалов одинакова, что соответствует максимальной энтропии:∑S 0 = −N 0 p k log p k .k17 Это равносильно обычному предположению о взаимной независимости зависимыхпеременных при условии, что значения независимых переменных заданы.18 В качестве априорного распределения y используется частотная гистограмма значенийпо совокупности данных D. Путем предобработки данных это распределение приводитсяк константе (т. н. неинформативный prior).19 Экспериментальные частоты в отсутствие другой информации являются наиболее вероятнойоценкой априорной плотности вероятности.УДК 004.032.26 (06) Нейронные сети 173
Page 1 and 2:
МИНИСТЕРСТВО ОБРАЗ
Page 4 and 5:
ISBN 5-7262-0471-9ЛЕКЦИИ ПО
Page 6 and 7:
Page 8 and 9:
Page 10 and 11:
Page 12 and 13:
Page 14 and 15:
Page 16 and 17:
Page 18 and 19:
Page 20 and 21:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
А. А. ФРОЛОВ 1) , Д. ГУ
Page 30 and 31:
Page 32 and 33:
Page 34 and 35:
Page 36 and 37:
Page 38 and 39:
Page 40 and 41:
Page 42 and 43:
Page 44 and 45:
Page 46 and 47:
Page 48 and 49:
Page 50 and 51:
Page 52 and 53:
Page 54 and 55:
Page 56 and 57:
Page 58 and 59:
Page 60 and 61:
Page 62 and 63:
Page 64 and 65:
Page 66 and 67:
Page 68 and 69:
Page 70 and 71:
Page 72 and 73:
Б. В. КРЫЖАНОВСКИЙ,
Page 74 and 75:
Page 76 and 77:
Page 78 and 79:
Page 80 and 81:
Page 82 and 83:
Page 84 and 85:
Page 86 and 87:
Н. Г. МАКАРЕНКОИнст
Page 88 and 89:
Page 90 and 91:
Page 92 and 93:
Page 94 and 95:
Page 96 and 97:
Page 98 and 99:
Page 100 and 101:
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
Page 114 and 115:
Page 116 and 117:
Page 118 and 119:
Page 120 and 121:
Page 122 and 123: ISBN 5-7262-0471-9ЛЕКЦИИ ПО
Page 188: НАУЧНАЯ СЕССИЯ МИФ
show all

ÑÐ¾ÑÐ¼Ð°Ñ Adobe PDF, ÑÐ°Ð·Ð¼ÐµÑ 2173 ÐÐ± - ÐÐ½ÑÐ¾ÑÐ¼Ð°ÑÐ¸Ð¾Ð½Ð½Ð¾ ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?

ÑÐ¾ÑÐ¼Ð°Ñ Adobe PDF, ÑÐ°Ð·Ð¼ÐµÑ 2173 ÐÐ± - ÐÐ½ÑÐ¾ÑÐ¼Ð°ÑÐ¸Ð¾Ð½Ð½Ð¾ ...