Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
набора дескрипторов и от применяемого метода, а практически целиком определяется<br />
базой данных, использованной для построения модели. Таким образом,<br />
дальнейшее совершенствование дескрипторного описания химически соединений<br />
и внедрение все более новых методов машинного обучения способно<br />
будет привести лишь к очень незначительным успехам, а для настоящего прорыва<br />
в этом направлении требуется выработка принципиально новых идей, которые<br />
позволили бы преодолевать ограничения, связанные с недостаточным<br />
объемом содержащейся в химических базах данных полезной информации.<br />
Между тем известно, что имеется принципиальная разница между методами<br />
машинного обучения и теми способами, которыми пользуется при обучении<br />
человек [477]. Если при машинном анализе данных для надежного построения<br />
сколько-нибудь сложной статистической модели требуется очень<br />
большой объем данных, то для человека для обучения значительно более сложным<br />
концепциям требуется удивительно мало примеров. Одна из причин этого<br />
заключается в том, что в настоящее время при машинном анализе данных каждая<br />
новая статистическая модель строится практически «с нуля», и получаемые<br />
таким образом модели оказываются изолированными друг от друга. Человек<br />
же, решая какую-нибудь задачу, всегда опирается на опыт, полученный при<br />
решении других задач. При освоении даже принципиально нового материала<br />
человек всегда пользуется аналогиями и метафорами, взятыми из ранее усвоенных<br />
знаний. Наконец, компоненты полученного знания тесно переплетены между<br />
собой в человеческом мозгу, что многократно ускоряет и облегчает процесс<br />
получения нового знания. Осознание этого привело в последние годы к<br />
формированию нового направления в теории машинного обучения, условно называемого<br />
“индуктивным переносом знаний”, которое занимается изучением<br />
того, как связывание между собой различных задач анализа данных приводит к<br />
улучшению качества получаемых моделей [477].<br />
Таким образом, один из путей преодоления ограничений, связанных с недостаточным<br />
объемом содержащихся в отдельных химических базах данных<br />
информации, видится в том, чтобы рассматривать разнообразные свойства химических<br />
соединений в их тесной взаимной связи и с учетом этого строить мо-<br />
263