Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
Ðа пÑÐ°Ð²Ð°Ñ ÑÑкопиÑи
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Табл. 16. Усредненные статистические показатели линейно-регрессионных моделей<br />
для прогнозирования температуры кипения органических соединений<br />
при варьировании максимального размера фрагментов<br />
Максимальное<br />
количество<br />
атомов<br />
во<br />
фрагментах<br />
Общее количество<br />
фрагментных<br />
дескрипторов<br />
Среднее<br />
число отобранных<br />
фрагментных<br />
дескрипторов<br />
БПМЛР<br />
R t RMSE t RMSE c RMSE p<br />
1 138 33±19 0,9642 17,7 18,6 20,5<br />
2 555 46±13 0,9814 12,9 16,7 18,6<br />
3 1744 46±20 0,9821 12,2 17,9 20,4<br />
4 2104 44±17 0,9838 11,8 18,2 19,5<br />
5 2327 42±14 0,9835 11,9 18,3 19,9<br />
6 2561 35±15 0,9801 13,1 18,3 20,4<br />
7 2706 37±16 0,9812 12,7 18,4 20,0<br />
8 2781 38±16 0,9827 12,1 17,3 20,0<br />
9 2821 37±17 0.9811 12,7 18,5 19,6<br />
10 2851 37±17 0.9811 12,7 18,6 19,6<br />
БПМЛР – быстрая пошаговая множественная линейная регрессия; R обуч – множественный<br />
коэффициент корреляции (квадратный корень от коэффициента<br />
детерминации) на обучающей выборке; RMSE обуч , RMSE контр , RMSE пред – среднеквадратичная<br />
ошибка в o C на обучающей, контрольной выборок и для выборки<br />
для оценки предсказательной способности, соответственно.<br />
Как видно из Табл. 16, минимальные значения среднеквадратичных ошибок<br />
для обучающей и двух контрольной выборок приходятся на наборы фрагментных<br />
дескрипторов с максимальным числом атомов, равным 2, 4 и 5, соответственно.<br />
В дальнейшем по ходу данной работы для построения нейросетевых<br />
моделей для прогнозирования температуры кипения органических соединений<br />
использовался только набор фрагментных дескрипторов с максимальным<br />
числом атомов, равным двум, поскольку при этом предсказательная способность<br />
модели, оцененная по среднеквадратичной ошибке на внутренней контрольной<br />
выборке, оказывается наилучшей.<br />
219