ÐÐ ÐÐЦÐÐ ÐÐ ÐÐÐÐЬÐЫХ ÐÐÐÐЩÐÐÐÐ: меÑодологиÑ, задаÑи ...
ÐÐ ÐÐЦÐÐ ÐÐ ÐÐÐÐЬÐЫХ ÐÐÐÐЩÐÐÐÐ: меÑодологиÑ, задаÑи ... ÐÐ ÐÐЦÐÐ ÐÐ ÐÐÐÐЬÐЫХ ÐÐÐÐЩÐÐÐÐ: меÑодологиÑ, задаÑи ...
236 объектов внутри кластера и, кроме того, строить иерархии таких кластеров по отношению «быть более общим, чем» [197, 197]. В рамках этой области сформулировано математическое определение формального понятия (ФП) и описано построение иерархий ФП. Исходно ФП является парой вида (объем, содержание), где под объемом понимается некоторое множество объектов, а под содержанием — множество их общих признаков. Как видим, это определение напоминает описание бикластера. Исходные данные в АФП представляются в виде объектно-признаковой матрицы, состоящей из нулей и единиц, а ФП является максимальный прямоугольник (с точностью до перестановок столбцов и строк) такой матрицы, заполненный единицами. Это означает, что данное подмножество объектов обладает всеми признаками некоторого подмножества признаков. Множество всех ФП упорядоченно и образует полную решетку, называемую «решеткой формальных понятий». В ряде работ исследуются возможности «ослабления» требований к определению ФП, например, рассматриваются шумоустойчивые понятия и нечеткие решетки понятий [69]. Необходимость такого рода ослаблений вызвана излишне жёсткой структурой ФП, требующей наличия всех признаков из содержания понятия у всех объектов его объема. Однако в случае наличия шума возможны «выпадения» некоторых признаков из содержания понятия. Сообщество FIMI (Frequent Itemset Mining Implementation) изучает проблемы поиска частых (замкнутых) множеств признаков в больших базах данных. Задача поиска частых множеств признаков является одной из центральных тем в Data Mining. Замкнутые множества признаков являются в точности содержаниями ФП. Поэтому методы FIMI можно отнести к моделям бикластеризации [69, 198]. Под термином бикластеризация в настоящее время понимается широкий круг методов, а потому для него в научной литературе существует целый ряд синонимов [69]: совместная кластеризация (simultaneous clustering), кокластеризация (co-clustering), двувходовая кластеризация (two-way clustering), кластеризация подпространства (subspace clustering), двумерная кластеризация (bidimensional) и бокс-кластеризация (boxclustering). Соответственно, требования, предъявляемые к понятию бикластера, различаются, а потому формальные определения даются только для конкретных случаев. Несмотря на такое разнообразие подходов, многие вопросы остаются открытыми, в частности, данные подходы не учитывают современных представлений о понятии (категории), как о сложно устроенном когнитивном феномене, не имеющем однозначной семантической репрезентации. Стало ясно [85], что процесс категоризации (выработки
237 понятия) устроен куда сложнее, чем определение сущности, объединяющей элементы с общими признаками. Свойственная человеку эмпирическая категоризация основывается на принципах, далеко отстоящих от тех закономерностей, которые воплощены в отмеченных выше подходах к бикластеризации. Когнитивный подход допускает ситуации, когда одни из объектов (прецедентов) в большей степени соответствуют представлению о понятии (категории), чем другие (понятиям, категориям свойственно иметь наилучших представителей). В отличие от обычной таксономии, категории, занимающие «серединное» положение в когнитивной иерархии, являются базовыми (примеры – экстремальный пограничный слой набросков, срединные домены). Основная часть знания структурируется именно на этом уровне. Таким образом, понятия, категории зависят от специфически человеческих способностей к восприятию, к созданию ментальных образов, к обучению и запоминанию, к эффективной коммуникации. Классические теории АФП и бикластеризации в этом отношении идеальны, поскольку в них понятия определяются исключительно в терминах общих характеристик их членов, а не в терминах специфических свойств человеческого понимания [85]. Принцип предельных обобщений предлагает когнитивный подход к бикластеризации, который включает в себя две группы моделей: - модели на основе замкнутых множеств (с учетом многоуровневости описаний); - модели на основе синдромного подхода, включая модели на основе орграфов набросков (главы 3, 6). Один из основных тезисов когнитивного подхода к АФП и бикластеризации заключается в том, что ключевое понятие «сходство» (задается операторами соответствия) имеет смысл только в рамках фиксированного уровня общности описания. Различные уровни общности описания прецедентов формируются системой координат феноменологического пространства наблюдателя в виде Банка тестов. Другой важный тезис заключается в априорной «многоликости» понятия (категории, образа), в суперпозиции смыслов, вкладываемых в понятие, в существовании ядра и периферии системных признаков понятия. Как следствие, предлагаемые модели обладают высокой устойчивостью к шумам за счет предельного обобщения и восстановления данных на основе моделей знаний. Первоначально рассмотрим модели на основе замкнутых множеств (отнесем их к классу идеализированных формальных понятий). Контекстом в АФП называют тройку K = (G, M, I), где G – множество объектов, например, множество ситуаций действительности Ω (множество прецедентов); M – множество признаков (в нашем случае – банк тестов), а
- Page 185 and 186: 185 спортсменов спри
- Page 187 and 188: 187 ГЛАВА 5. МЕТОД ПРЕ
- Page 189 and 190: 189 синдромов в меди
- Page 191 and 192: 191 существует единс
- Page 193 and 194: 193 Сведем в один алг
- Page 195 and 196: 195 Описание «T1 - B3» О
- Page 197 and 198: 197 описания {τ/T 0 } мо
- Page 199 and 200: 199 Видно, что {τ/T} {S} =
- Page 201 and 202: 201 «T3 - B2» S = (τ 1 /T3 Но
- Page 203 and 204: 203 for α ∈ Ω do {S * } Full :=
- Page 205 and 206: 205 модель знаний {S},
- Page 207 and 208: 207 которые классифи
- Page 209 and 210: 209 предельных обобщ
- Page 211 and 212: 211 один синдром. В р
- Page 213 and 214: 213 Выход: Модель зна
- Page 215 and 216: 215 минимальное числ
- Page 217 and 218: 217 Таблица 5.7 - Приме
- Page 219 and 220: 219 Пусть α({τ/T}, z/Z) - н
- Page 221 and 222: 221 и {τ} S’ ({S, S’}⊆{S}),
- Page 223 and 224: 223 предполагать для
- Page 225 and 226: 225 Описание {τ/T} наз
- Page 227 and 228: 227 доминирование. П
- Page 229 and 230: 229 Выход: Маркер кри
- Page 231 and 232: 231 произвольный арт
- Page 233 and 234: 233 3 {Сниженное ^a; Но
- Page 235: 235 Главный результа
- Page 239 and 240: 239 синдромной модел
- Page 241 and 242: 241 существуют i, j та
- Page 243 and 244: 243 {α}’| F = {b/B} F = F ({α},
- Page 245 and 246: 245 B3») является такж
- Page 247 and 248: 247 Таблица 5.13 - Обуч
- Page 249 and 250: 249 2} 2 {Норма ^0 [1,40; 2,10
- Page 251 and 252: 251 ГЛАВА 6. МНОГОУРО
- Page 253 and 254: 253 обезразмеривани
- Page 255 and 256: 255 получаемой чувст
- Page 257 and 258: 257 предпоследнем сл
- Page 259 and 260: 259 «заколок» в опер
- Page 261 and 262: 261 то K(W) = 0 и FS(W) ≡ W,
- Page 263 and 264: 263 На рис. 6.3 показан
- Page 265 and 266: 265 (V/Gs(W)) -1 = {P’ | ∃T ∈
- Page 267 and 268: 267 Орграф набросков
- Page 269 and 270: 269 построения оргра
- Page 271 and 272: 271 VI этап Формирова
- Page 273 and 274: 273 заключается в пр
- Page 275 and 276: 275 Шаг 1. Выявляем на
- Page 277 and 278: 277 множество стабил
- Page 279 and 280: 279 состояния новоро
- Page 281 and 282: 281 Среднее АД ^САД { 3
- Page 283 and 284: 283 информационных т
- Page 285 and 286: 285 часть этого прос
237<br />
понятия) устроен куда сложнее, чем определение сущности, объединяющей<br />
элементы с общими признаками. Свойственная человеку эмпирическая<br />
категоризация основывается на принципах, далеко отстоящих от тех<br />
закономерностей, которые воплощены в отмеченных выше подходах к<br />
бикластеризации. Когнитивный подход допускает ситуации, когда одни из<br />
объектов (прецедентов) в большей степени соответствуют представлению о<br />
понятии (категории), чем другие (понятиям, категориям свойственно иметь<br />
наилучших представителей). В отличие от обычной таксономии, категории,<br />
занимающие «серединное» положение в когнитивной иерархии, являются<br />
базовыми (примеры – экстремальный пограничный слой набросков,<br />
срединные домены). Основная часть знания структурируется именно на<br />
этом уровне. Таким образом, понятия, категории зависят от специфически<br />
человеческих способностей к восприятию, к созданию ментальных образов,<br />
к обучению и запоминанию, к эффективной коммуникации. Классические<br />
теории АФП и бикластеризации в этом отношении идеальны, поскольку в<br />
них понятия определяются исключительно в терминах общих<br />
характеристик их членов, а не в терминах специфических свойств<br />
человеческого понимания [85].<br />
Принцип предельных обобщений предлагает когнитивный подход к<br />
бикластеризации, который включает в себя две группы моделей:<br />
- модели на основе замкнутых множеств (с учетом многоуровневости<br />
описаний);<br />
- модели на основе синдромного подхода, включая модели на основе<br />
орграфов набросков (главы 3, 6).<br />
Один из основных тезисов когнитивного подхода к АФП и<br />
бикластеризации заключается в том, что ключевое понятие «сходство»<br />
(задается операторами соответствия) имеет смысл только в рамках<br />
фиксированного уровня общности описания. Различные уровни общности<br />
описания прецедентов формируются системой координат<br />
феноменологического пространства наблюдателя в виде Банка тестов.<br />
Другой важный тезис заключается в априорной «многоликости» понятия<br />
(категории, образа), в суперпозиции смыслов, вкладываемых в понятие, в<br />
существовании ядра и периферии системных признаков понятия. Как<br />
следствие, предлагаемые модели обладают высокой устойчивостью к<br />
шумам за счет предельного обобщения и восстановления данных на основе<br />
моделей знаний.<br />
Первоначально рассмотрим модели на основе замкнутых множеств<br />
(отнесем их к классу идеализированных формальных понятий).<br />
Контекстом в АФП называют тройку K = (G, M, I), где G – множество<br />
объектов, например, множество ситуаций действительности Ω (множество<br />
прецедентов); M – множество признаков (в нашем случае – банк тестов), а