19.11.2014 Views

На правах рукописи

На правах рукописи

На правах рукописи

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

набора дескрипторов и от применяемого метода, а практически целиком определяется<br />

базой данных, использованной для построения модели. Таким образом,<br />

дальнейшее совершенствование дескрипторного описания химически соединений<br />

и внедрение все более новых методов машинного обучения способно<br />

будет привести лишь к очень незначительным успехам, а для настоящего прорыва<br />

в этом направлении требуется выработка принципиально новых идей, которые<br />

позволили бы преодолевать ограничения, связанные с недостаточным<br />

объемом содержащейся в химических базах данных полезной информации.<br />

Между тем известно, что имеется принципиальная разница между методами<br />

машинного обучения и теми способами, которыми пользуется при обучении<br />

человек [477]. Если при машинном анализе данных для надежного построения<br />

сколько-нибудь сложной статистической модели требуется очень<br />

большой объем данных, то для человека для обучения значительно более сложным<br />

концепциям требуется удивительно мало примеров. Одна из причин этого<br />

заключается в том, что в настоящее время при машинном анализе данных каждая<br />

новая статистическая модель строится практически «с нуля», и получаемые<br />

таким образом модели оказываются изолированными друг от друга. Человек<br />

же, решая какую-нибудь задачу, всегда опирается на опыт, полученный при<br />

решении других задач. При освоении даже принципиально нового материала<br />

человек всегда пользуется аналогиями и метафорами, взятыми из ранее усвоенных<br />

знаний. Наконец, компоненты полученного знания тесно переплетены между<br />

собой в человеческом мозгу, что многократно ускоряет и облегчает процесс<br />

получения нового знания. Осознание этого привело в последние годы к<br />

формированию нового направления в теории машинного обучения, условно называемого<br />

“индуктивным переносом знаний”, которое занимается изучением<br />

того, как связывание между собой различных задач анализа данных приводит к<br />

улучшению качества получаемых моделей [477].<br />

Таким образом, один из путей преодоления ограничений, связанных с недостаточным<br />

объемом содержащихся в отдельных химических базах данных<br />

информации, видится в том, чтобы рассматривать разнообразные свойства химических<br />

соединений в их тесной взаимной связи и с учетом этого строить мо-<br />

263

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!