Электронный журнал открытого доступа Кардиометрия. Выпуск 16, Мая 2020

Как всегда, тема нашего журнала продиктована актуальностью нашей жизни. Наши учёные внимательно анализировали сложившуюся ситуацию и не спешили делать далеко идущие выводы. Время показало нам пути решения сложнейших вопросов. Вывод один: человек должен быть сам здоров, а значит, иметь оптимально функционирующую иммунную систему. Мы попросили некоторых авторов, публиковавшихся в журнале, высказать свои рекомендации по укреплению иммунной системы. Мы уверены, что они будут полезны каждому. Они и открывают наш журнал. Как всегда, тема нашего журнала продиктована актуальностью нашей жизни. Наши учёные внимательно анализировали сложившуюся ситуацию и не спешили делать далеко идущие выводы. Время показало нам пути решения сложнейших вопросов. Вывод один: человек должен быть сам здоров, а значит, иметь оптимально функционирующую иммунную систему. Мы попросили некоторых авторов, публиковавшихся в журнале, высказать свои рекомендации по укреплению иммунной системы. Мы уверены, что они будут полезны каждому. Они и открывают наш журнал.

05.06.2020 Views

ния других участников переписки, пользователиимели возможность определить актуальность такойпереписки для себя лично, хотя, несомненно,создание дополнительного запроса занималобольше время и требовала определенных действийот пользователей. Затем появились системы, самостоятельноколлекционирующие релевантныемнения и обобщающие эти мнения для представлениярекомендаций. Например, в программномкомпоненте GroupLens [11] данный метод использовалсядля идентификации материалов в сетиUsenet, которые могли бы представлять интересдля определенного пользователя. Пользователямпредлагалось дать оценку материалам, а система,в свою очередь, объединяла их с оценками другихпользователей для предоставления персонализированныхрезультатов. По мере развития машинногообучения и информационного поиска, болееуглубленного изучения проблем взаимодействиячеловека и машины, рекомендательные системыприобретали всё большую популярность. В результатеэтого, они все чаще стали применяться вмузыке, кино и большом количестве других продуктов.Рекомендательные системы все чаще сталипоявляться также вне индустрии информационныхтехнологий, например, в сфере торговли, какодин из способов увеличения количества продаж.В конце девяностых годов на рынке появилиськоммерческие рекомендательные системы. Наверное,самым известным разработчиком данныхпродуктов тогда являлась компания Amazon [12].Интерес пользователя к определенному товарурассчитывался на основе истории покупок и просмотровэтого пользователя, а также на просматриваемомим в данный момент времени товаре.После этого множество других коммерческихкомпаний сегмента начали внедрять рекомендательныесистемы, а некоторые фирмы даже сделаливнедрение рекомендательных систем своимосновным бизнесом. В 2006 году фирма Netflixзапустила соревнование Netflix Prize, целью которогобыло создание алгоритма рекомендаций,который смог бы улучшить результат действующеговнутреннего алгоритма CineMatch в тестахна 10% [13]. Это подстегнуло интерес к широкомуиспользованию рекомендательных систем и вызвалоактивность, как в научных кругах, так и средикоммерческих разработчиков. Победителямбыл обещан 1 млн. долларов США, что говорит означимости рекомендательных систем для сферыинформационных технологий. Одновременно сэтим, компания Google разработала свою системурекомендаций новостей Google News. Системаобрабатывает историю кликов, совершенныхпользователями, и предоставляет рекомендациюдля конкретного пользователя. В случае с GoogleNews новостные материалы рассматриваютсякак объекты интереса, а клики пользователей какприсвоение положительного рейтинга новостномуматериалу. К собранным подобным образомоценкам применяется алгоритм коллаборативнойфильтрации и, основываясь на выходных данных,принимается решение рекомендовать тот илииной материал конкретному пользователю.Начало 21-го века характеризуется взрывнымростом популярности социальных сетей. Естественно,рекомендательные системы нашли своеприменение и в них. Facebook – крупнейшая социальнаясеть, первой внедрила алгоритмы рекомендацийпотенциальных социальных связей.Такие рекомендации несут несколько иные цели,чем рекомендации продукта: социальные сетив значительной степени зависят от их роста дляувеличения доходов от рекламы, поэтому рекомендациипотенциальных друзей обеспечиваютбыстрый рост и связность сети. Эта задача такженазывается прогнозированием ссылок в областианализа графов сетей. Поэтому природа данноготипа алгоритмов несколько отлична от стандартныхрекомендательных алгоритмов, но, в целом,суть остается той же.Классификация рекомендательных системМожно выделить три основных типа рекомендательныхсистем: фильтрация содержимого, коллаборативнаяфильтрация и гибридные системы.При фильтрации содержимого (контентнаяфильтрация, content-based filtering) создаютсяпрофили пользователей и объектов. Профилипользователей могут включать демографическуюинформацию или ответы на определённый наборвопросов [14]. Профили объектов могут включатьназвания жанров, имена актёров, имена исполнителейи тому подобное – в зависимости от типаобъекта. Пользователю рекомендуются объекты,похожие на те, которые этот пользователь ужеупотребил. Похожести оцениваются по признакамсодержимого объектов. Главными проблемами та-102 | Cardiometry | Выпуск 16. Май 2020

ких систем являются сильная зависимость от предметнойобласти, а также тот факт, что полезностьрекомендаций ограничена. Плюсами данного подходаявляется то, что можно давать рекомендациидаже незнакомым пользователям, тем самым вовлекаяих в сервис, появляется возможность рекомендоватьте объекты, которые еще не были никемоценены. К минусам можно отнести более низкуюточность, возросшую скорость разработки.При коллаборативной фильтрации (совместнаяфильтрация, collaborative filtering) используетсяинформация о поведении пользователейв прошлом - например, информация о покупкахили оценках. Такие системы основаны на схожестипредпочтений пользователей. В этом случае неимеет значения, с какими типами объектов ведётсяработа, но при этом могут учитываться неявныехарактеристики, которые сложно было бы учестьпри создании профиля. Основное допущение методасостоит в следующем: те, кто одинаково оцениваликакие-либо предметы в прошлом, склонныдавать похожие оценки другим предметам и вбудущем. Прогнозы составляются индивидуальнодля каждого пользователя, хотя используемаяинформация собрана от многих участников. Обаварианта предсказывают, в какой степени пользовательбудет интересоваться объектами, которыедо сих пор не были им оценены [15-20].Коллаборативная фильтрация, в свою очередь,также разделяется на 2 основных подхода (типа):1. user-based подход, т.е. «основанный на соседстве»2. item-based подход, т.е. «основанный на модели»User-based – исторически первый и реализуетсяв большинстве систем. При применении userbasedдля активного пользователя подбираетсягруппа пользователей схожих с ним. Для подборарекомендаций активному пользователю учитываетсякомбинация весов и оценок группы. Дляэтого каждому пользователю группы присваиваетсявес с учётом схожести его оценок с оценкамиактивного пользователя. Пользователей, оценкикоторых максимально приближены к оценкам активногопользователя, объединяют в одну группу,называемую соседней. С учетом оценок этих соседейвыполняется предсказание оценок активногопользования и на этом основание система генерируетрекомендации [15-20].Item-based измеряет параметры статистическихмоделей для оценок пользователей. Для построенияподобных моделей применяются различныеметоды, наиболее распространенные изкоторых следующие: кластеризация, байесовскиесети, построение латентной семантической модели,марковский процесс принятия решений и прочие.Модели разрабатываются с использованиеминтеллектуального анализа данных, алгоритмовмашинного обучения, чтобы найти закономерностина основе обучающих данных [15-20].Подход item-based даёт более релевантные результаты,так как глубже анализирует факторы,объясняющие наблюдаемые оценки. Лучше, нежелив user-based, обрабатываются разреженныематрицы, что способствует масштабируемостибольших наборов данных. Но, при этом, имеетсявероятность потери полезной информации в связис сокращением моделей.Основной проблемой коллаборативной фильтрацииявляется так называемая проблема «холодногостарта», т.е. фактическое отсутствие данныхо новых объектах или пользователях [15-20].Новые предметы или пользователи представляютбольшую проблему для рекомендательных систем.Необходим высокий порог входа - не знаяничего об интересах пользователя, рекомендациипрактически бесполезны. В некоторой мере этупроблему можно решить используя контентныйподход, который, как известно, использует атрибутывместо оценок. Помимо проблемы «холодногостарта», можно также отметить проблему,связанную с неспособностью рекомендательнойсистемы отличать одинаковые предметы, имеющиеразличные имена. Одинаковые предметы,имеющие разные имена, называются синонимичными.Большинство современных систем не способныобнаружить скрытые связи между синонимичнымиобъектами. Интерес может вызватьтакже проблема «белых ворон». «Белые вороны»– это пользователи, имеющие непохожие вкусы,их мнение всегда не совпадает с большинствомдругих. Соответственно, им невозможно что-либорекомендовать. Но необходимо отметить, чтопроблемы таких пользователи исходят из реальнойжизни, поэтому назвать это проблемой рекомендательныхсистем было бы не совсем корректно.К плюсам коллаборативной фильтрацииможно отнести теоретически высокую точность.Гибридные системы (hybrid) сочетают коллаборативнуюи контентную фильтрацию, повышаяВыпуск 16. май 2020 | Cardiometry | 103

ния других участников переписки, пользователи

имели возможность определить актуальность такой

переписки для себя лично, хотя, несомненно,

создание дополнительного запроса занимало

больше время и требовала определенных действий

от пользователей. Затем появились системы, самостоятельно

коллекционирующие релевантные

мнения и обобщающие эти мнения для представления

рекомендаций. Например, в программном

компоненте GroupLens [11] данный метод использовался

для идентификации материалов в сети

Usenet, которые могли бы представлять интерес

для определенного пользователя. Пользователям

предлагалось дать оценку материалам, а система,

в свою очередь, объединяла их с оценками других

пользователей для предоставления персонализированных

результатов. По мере развития машинного

обучения и информационного поиска, более

углубленного изучения проблем взаимодействия

человека и машины, рекомендательные системы

приобретали всё большую популярность. В результате

этого, они все чаще стали применяться в

музыке, кино и большом количестве других продуктов.

Рекомендательные системы все чаще стали

появляться также вне индустрии информационных

технологий, например, в сфере торговли, как

один из способов увеличения количества продаж.

В конце девяностых годов на рынке появились

коммерческие рекомендательные системы. Наверное,

самым известным разработчиком данных

продуктов тогда являлась компания Amazon [12].

Интерес пользователя к определенному товару

рассчитывался на основе истории покупок и просмотров

этого пользователя, а также на просматриваемом

им в данный момент времени товаре.

После этого множество других коммерческих

компаний сегмента начали внедрять рекомендательные

системы, а некоторые фирмы даже сделали

внедрение рекомендательных систем своим

основным бизнесом. В 2006 году фирма Netflix

запустила соревнование Netflix Prize, целью которого

было создание алгоритма рекомендаций,

который смог бы улучшить результат действующего

внутреннего алгоритма CineMatch в тестах

на 10% [13]. Это подстегнуло интерес к широкому

использованию рекомендательных систем и вызвало

активность, как в научных кругах, так и среди

коммерческих разработчиков. Победителям

был обещан 1 млн. долларов США, что говорит о

значимости рекомендательных систем для сферы

информационных технологий. Одновременно с

этим, компания Google разработала свою систему

рекомендаций новостей Google News. Система

обрабатывает историю кликов, совершенных

пользователями, и предоставляет рекомендацию

для конкретного пользователя. В случае с Google

News новостные материалы рассматриваются

как объекты интереса, а клики пользователей как

присвоение положительного рейтинга новостному

материалу. К собранным подобным образом

оценкам применяется алгоритм коллаборативной

фильтрации и, основываясь на выходных данных,

принимается решение рекомендовать тот или

иной материал конкретному пользователю.

Начало 21-го века характеризуется взрывным

ростом популярности социальных сетей. Естественно,

рекомендательные системы нашли свое

применение и в них. Facebook – крупнейшая социальная

сеть, первой внедрила алгоритмы рекомендаций

потенциальных социальных связей.

Такие рекомендации несут несколько иные цели,

чем рекомендации продукта: социальные сети

в значительной степени зависят от их роста для

увеличения доходов от рекламы, поэтому рекомендации

потенциальных друзей обеспечивают

быстрый рост и связность сети. Эта задача также

называется прогнозированием ссылок в области

анализа графов сетей. Поэтому природа данного

типа алгоритмов несколько отлична от стандартных

рекомендательных алгоритмов, но, в целом,

суть остается той же.

Классификация рекомендательных систем

Можно выделить три основных типа рекомендательных

систем: фильтрация содержимого, коллаборативная

фильтрация и гибридные системы.

При фильтрации содержимого (контентная

фильтрация, content-based filtering) создаются

профили пользователей и объектов. Профили

пользователей могут включать демографическую

информацию или ответы на определённый набор

вопросов [14]. Профили объектов могут включать

названия жанров, имена актёров, имена исполнителей

и тому подобное – в зависимости от типа

объекта. Пользователю рекомендуются объекты,

похожие на те, которые этот пользователь уже

употребил. Похожести оцениваются по признакам

содержимого объектов. Главными проблемами та-

102 | Cardiometry | Выпуск 16. Май 2020

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!