RU2844072C2

RU2844072C2 - Система и способ формирования обучающего набора данных для обучения алгоритма машинного обучения

Info

Publication number: RU2844072C2
Application number: RU2022133953A
Authority: RU
Inventors: Даниил Сергеевич Бурлаков; Вадим Сергеевич Шилов
Original assignee: Общество с ограниченной ответственностью "Яндекс Музыка"
Filing date: 2022-12-22
Publication date: 2025-07-25

Abstract

Изобретение относится к способам формирования рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы. Технический результат заключается в повышении эффективности работы рекомендательной платформы за счет решения проблемы холодного старта. Технический результат достигается за счет того, что способ включает в себя формирование синтезированных пользовательских откликов для новых цифровых элементов, не имеющих фактического пользовательского отклика; формирование включает в себя: на первом этапе - обучение сервером оценивающей модели машинного обучения определению прогнозируемого указания на пользовательский отклик для цифрового элемента; и на втором этапе - получение указания на новый цифровой элемент поставщика новых элементов, применение оценивающей модели машинного обучения в отношении нового цифрового элемента для определения указания на его синтезированный пользовательский отклик и формирование на основе новых цифровых элементов с назначенными для них указаниями на синтезированные пользовательские отклики обучающего набора данных для обучения алгоритма MLA. 3 н. и 17 з.п. ф-лы, 10 ил.

Description

Область техники, к которой относится изобретение

[001] Настоящая технология в целом относится к рекомендательным системам и, в частности, к способу формирования обучающего набора данных для обучения алгоритма машинного обучения предоставлению рекомендаций элементов пользователям рекомендательной системы.

Уровень техники

[002] На рекомендательных онлайн-платформах размещаются различные цифровые элементы для их предоставления пользователям. Некоторые рекомендательные онлайн-платформы содержат сервисы потоковой трансляции, например, сервисы потокового аудио или видео, такие как сервис потокового аудио Spotify™, сервис потокового аудио Yandex.Music™, сервис потокового видео Netflix™, сервис потокового видео Amazon™ Prime Video и т.п., на которых размещены различные фонограммы и видеоклипы. Другие рекомендательные онлайн-платформы могут быть реализованы в виде платформ онлайн-списков, таких как платформа онлайн-списков Yandex.Market™, платформа онлайн-списков Amazon™, платформа онлайн-списков Ozon.ru™ и т.д., благодаря которым их пользователи могут приобретать различные товары и услуги в режиме «онлайн». Таким образом, различные поставщики элементов, такие как певцы, кинопродюсеры или интернет-магазины загружают миллионы или даже десятки миллионов цифровых элементов на рекомендательную онлайн-платформу для представления их пользователям.

[003] Чтобы способствовать навигации пользователя среди такого количества цифровых элементов, размещенных на рекомендательной онлайн-платформе, и повысить удовлетворенность пользователя платформы от взаимодействия с ней, рекомендательная онлайн-платформа может предоставлять пользователю пользовательские рекомендации. Например, пользователь может оценивать на рекомендательной онлайн-платформе цифровой элемент, такой как фонограмма на сервисе потокового аудио, а рекомендательная онлайн-платформа может предоставлять после этого цифрового элемента рекомендуемый цифровой элемент для оценивания. В другом примере рекомендательная онлайн-платформа может определять и затем предоставлять рекомендуемые цифровые элементы пользователю в ответ на запуск пользователем рекомендательной онлайн-платформы на его электронном устройстве или в ответ на отправку общего запроса рекомендаций. Например, рекомендуемые цифровые элементы могут иметь схожую категорию или могут предоставляться тем же поставщиком.

[004] В общем случае для формирования индивидуальных пользовательских рекомендаций для пользователей такие рекомендательные онлайн-платформы могут выполнять специально обученный для этой цели алгоритм машинного обучения (MLA, Machine-Learning Algorithm). В частности, алгоритм MLA может быть обучен на основе обучающего набора данных, содержащего различные признаки, указывающие (а) на пользователей рекомендательной онлайн-платформы и/или (б) на размещенные на ней цифровые элементы и/или (в) на прошлые пользовательские действия пользователей с цифровыми элементами. Последние могут включать в себя пользовательские отклики, оставляемые пользователями для цифровых элементов после ознакомления с ними, такие как отзыв «Like» («Нравится») или «Dislike» («Не нравится»), комментарии и т.п.

[005] При этом новые цифровые элементы, загруженные на рекомендательную онлайн-платформу, могут не иметь некоторых признаков вследствие отсутствия предыдущих пользовательских откликов от пользователей и поэтому могут игнорироваться алгоритмом MLA при формировании пользовательских рекомендаций. В данной области техники эта проблема известна как проблема холодного старта, когда новые цифровые элементы не рекомендуются пользователям рекомендательной онлайн-платформы, поскольку другие пользователи еще не взаимодействовали с ними или не оценивали их. Следовательно, пользователи могут не получать релевантных пользовательских рекомендаций, содержащих новые цифровые элементы, а поставщики новых элементов могут не получать свою целевую аудиторию на рекомендательной онлайн-платформе. В результате возможно негативное влияние на удовлетворенность пользователя для обеих сторон.

[006] Для решения описанной выше технической проблемы предложены некоторые известные подходы.

[007] В патентной заявке US 2006085818 A1 «Introducing new content items in a community-based recommendation system» (Koninklijke Philips NV, опубл. 20 апреля 2006 г.) описан способ работы с элементами контента, формирования профиля пользовательских предпочтений и представления новых элементов контента в рекомендательной системе на основе сообществ. При обнаружении доступности нового элемента контента виртуальный пользовательский терминал определяет новый профиль пользовательских предпочтений. Виртуальный пользовательский терминал содержит процессор инициализации, который задает для нового элемента контента значение предпочтения в профиле пользовательских предпочтений. Виртуальный пользовательский терминал дополнительно содержит процессор взаимосвязей, который определяет соответствующие элементы контента, и процессор профиля, который задает значения предпочтений в профиле пользовательских предпочтений, связанном с по меньшей мере одним элементом контента. Таким образом формируется взаимосвязь между первым элементом контента и упомянутыми элементами контента, в результате чего новый элемент контента связывается с имеющимися элементами контента и, следовательно, вероятность рекомендации нового элемента контента увеличивается.

[008] В патентной заявке CN 114238752 A «Article recommendation method and device and storage medium» (Hunan University, опубл. 25 марта 2022 г.) описан способ рекомендации элементов и оборудование, повышающие точность холодного старта. Способ включает в себя следующие шаги: определение мультимодальной информации для каждого объекта холодного старта из набора объектов холодного старта и мультимодальной информации для каждого объекта горячего старта из набора объектов горячего старта, при этом мультимодальная информация содержит по меньшей мере два элемента из числа идентификационной информации, характеристик визуальной информации, характеристик аудиоинформации и характеристик текстовой информации; выполнение иерархической кластеризации согласно мультимодальной информации каждого объекта холодного старта и каждого объекта горячего старта с целью получения множества результатов кластеризации; формирование дополнительного графа взаимодействий между каждым объектом холодного старта и каждым объектом горячего старта согласно множеству результатов кластеризации, при этом объект горячего старта соответствует набору объектов горячего старта; определение первого окончательного представления каждого объекта холодного старта и второго окончательного представления объекта горячего старта, соответствующего каждому объекту холодного старта согласно дополнительному графу взаимодействий; и рекомендацию каждого объекта холодного старта согласно первому окончательному представлению и второму окончательному представлению.

[009] В патенте CN 10833492 B «Personalized recommendation method based on combination of content and collaborative filtering» (Nanjing University of Posts and Telecommunications, выдан 2 ноября 2021 г.) описан способ персонализированных рекомендаций на основе сочетания контента и совместной фильтрации, который включает в себя два этапа обучения и персонализированных рекомендаций: на этапе обучения путем сбора данных формируется матрица предварительных рекомендаций «имеющийся пользователь»-«новый элемент»; на этапе персонализированных рекомендаций выполняется рекомендация элемента для нового пользователя и дополнительная рекомендация после формирования пользователем оценок. По сравнению с традиционным способом персонализированных рекомендаций данные способ и система позволяют решать проблему холодного старта, выполнять прогноз для вновь добавленных элементов, рекомендовать вновь добавленные элементы пользователю и использовать рекомендацию на основе совместной фильтрации после предварительной рекомендации таким образом, чтобы повысить разнообразие и правильность рекомендуемых элементов. Кроме того, благодаря формированию виртуальных пользователей с помощью алгоритма кластеризации значительно уменьшается размер матрицы и снижается сложность расчетов.

Раскрытие изобретения

[010] В связи с изложенным требуются системы и способы, позволяющие избегать, уменьшать или преодолевать ограничения известных технологий.

[011] Разработчики настоящей технологии разработали способы и системы для решения проблемы холодного старта для новых цифровых элементов, загруженных на рекомендательную онлайн-платформу. В частности, разработчики разработали способы и системы для формирования синтезированных пользовательских откликов для новых цифровых элементов на основе фактического пользовательского отклика, предоставленного для имеющихся старых цифровых элементов рекомендательной онлайн-платформы ее пользователями.

[012] В некоторых не имеющих ограничительного характера вариантах осуществления данной технологии настоящие способы и системы предназначены для обучения оценивающей модели машинного обучения (ML, Machine Learning) определению синтезированных пользовательских откликов для назначения новым цифровым элементам. В частности, в этих вариантах осуществления изобретения оценивающая модель ML обучается воспроизведению текущего распределения откликов для указаний на фактические пользовательские отклики, предоставленные для старых цифровых элементов, например, такие как положительные и отрицательные отзывы.

[013] Согласно по меньшей мере другим не имеющим ограничительного характера вариантам осуществления настоящей технологии, синтезированные пользовательские отклики для новых цифровых элементов, загруженных на рекомендательную онлайн-платформу поставщиком новых элементов, могут имитировать фактические пользовательские отклики, предоставленные для старых цифровых элементов поставщика старых элементов, подобного поставщику новых элементов. В этой связи в этих вариантах осуществления изобретения настоящие способы и системы предназначены (а) для определения текущего распределения откликов для указаний на фактические пользовательские отклики, предоставленные для старых цифровых элементов поставщика старых элементов, и (б) для назначения указаний на синтезированные пользовательские отклики для новых цифровых элементов согласно определенному таким образом текущему распределению откликов.

[014] Новые цифровые элементы с такими синтезированными пользовательскими откликами рассматриваются алгоритмом MLA рекомендательной онлайн-платформы и за счет этого могут получать пользовательские рекомендации для пользователей. Таким образом, способы, описанные в настоящем документе, способны обеспечивать лучшее представление новых цифровых элементов пользователям рекомендательной онлайн-платформы, позволяя новым цифровым элементам получать фактические пользовательские отклики, которые (если они отличаются) могут в дальнейшем заменять синтезированные пользовательские отклики.

[015] Следовательно, различные не имеющие ограничительного характера варианты осуществления настоящей технологии позволяют повышать удовлетворенность пользователей и поставщиков элементов рекомендательных онлайн-платформ.

[016] В частности, согласно первому аспекту настоящей технологии реализован способ формирования обучающего набора данных для обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы. Рекомендательная онлайн-платформа содержит множество цифровых элементов. Множество цифровых элементов содержит: (1) старую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу одним из множества поставщиков старых элементов, при этом по меньшей мере некоторые старые цифровые элементы из старой части цифровых элементов получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы, а указания на пользовательские отклики по меньшей мере некоторых старых цифровых элементов распределены в старой части цифровых элементов согласно распределению откликов; и (2) новую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу поставщиком новых элементов из множества поставщиков новых элементов и не имеет пользовательского отклика. Формирование обучающего набора данных включает в себя формирование синтезированных пользовательских откликов для новых цифровых элементов. Способ выполняется сервером, на котором размещена рекомендательная онлайн-платформа. Способ включает в себя: на первом этапе - обучение сервером оценивающей модели ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента, при этом обучение включает в себя получение сервером указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом, ввод сервером множества цифровых объектов для оценивания в оценивающую модель ML и обучение таким образом оценивающей модели ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных; на втором этапе, следующем за первым этапом, - получение сервером указания на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов; применение сервером оценивающей модели ML в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента; формирование сервером обучающего набора данных, содержащего множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и ввод сервером множества обучающих цифровых объектов в алгоритм MLA для обучения алгоритма MLA формированию рекомендаций цифровых элементов.

[017] В некоторых вариантах осуществления способа применение оценивающей модели ML включает в себя определение первого значения вероятности получения указания на положительный пользовательский отклик новым цифровым элементом поставщика новых цифровых элементов, при этом определение основано на оценке сходства поставщика новых элементов со множеством поставщиков старых элементов.

[018] В некоторых вариантах осуществления способа первое значение вероятности определяется по формуле:

,

где artistScore - оценка сходства поставщика новых элементов со множеством поставщиков старых элементов, a и b - коэффициенты, определенные путем обучения оценивающей модели машинного обучения.

[019] В некоторых вариантах осуществления способа он дополнительно включает в себя определение сервером оценки сходства поставщика новых элементов со множеством поставщиков старых элементов.

[020] В некоторых вариантах осуществления способа определение оценки сходства поставщика новых элементов включает в себя: получение для поставщика старых элементов из множества поставщиков старых элементов значения параметра сходства поставщика старых элементов с поставщиком новых элементов; формирование сервером на основе значений параметра сходства каждого поставщика из множества поставщиков старых элементов с поставщиком новых элементов ориентированной графовой структуры, где вершина ориентированной графовой структуры представляет поставщика элементов из множества поставщиков старых элементов или из множества поставщиков новых элементов, а ребро, соединяющее пару вершин, представляет ненулевое значение параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов; определение сервером для ребра весового значения, указывающего на значение параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов; и определение сервером оценки сходства поставщика новых элементов в качестве максимального суммарного весового значения при переходе от вершины ориентированной графовой структуры, связанной с поставщиком новых элементов, к ее начальной вершине.

[021] В некоторых вариантах осуществления способа определение весового значения включает в себя определение обратного значения для значения параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов.

[022] В некоторых вариантах осуществления способа параметр сходства представляет собой степень сходства поставщика новых элементов с каждым из множества поставщиков старых элементов.

[023] В некоторых вариантах осуществления способа он дополнительно включает в себя получение от оценщика-человека степени сходства поставщика новых элементов с каждым из множества поставщиков старых элементов.

[024] В некоторых вариантах осуществления способа применение оценивающей модели ML дополнительно включает в себя определение второго значения вероятности получения указания на положительный пользовательский отклик новым цифровым элементом поставщика новых цифровых элементов, при этом определение основано на значении популярности нового цифрового элемента в данной области.

[025] В некоторых вариантах осуществления способа второе значение вероятности определяется по формуле:

,

где Popularity - значение популярности нового цифрового элемента в данной области, maxPopularity - значение популярности наиболее популярного в данной области нового цифрового элемента из соответствующего множества цифровых элементов поставщика новых элементов, minPopularity - значение популярности наименее популярного в данной области нового цифрового элемента из соответствующего множества цифровых элементов поставщика новых элементов, c и d - коэффициенты, определенные путем обучения оценивающей модели машинного обучения.

[026] В некоторых вариантах осуществления способа новый цифровой элемент представляет собой аудиопоток, а значение популярности нового цифрового элемента указывает на по меньшей мере одно из следующего: (а) количество потоков аудиопотока на медиа-ресурсе, (б) количество запросов на воспроизведение аудиопотока на медиа-ресурсе, (в) позиция аудиопотока в хит-параде и (г) количество проданных альбомов, содержащих аудиопоток.

[027] В некоторых вариантах осуществления способа он дополнительно включает в себя назначение сервером новому цифровому элементу указания на положительный синтезированный пользовательский отклик, если первое и/или второе значение вероятности больше верхнего порога вероятности, и назначение сервером новому цифровому элементу указания на отрицательный синтезированный пользовательский отклик, если первое и/или второе значение вероятности меньше нижнего порога вероятности, который меньше верхнего порога вероятности.

[028] В некоторых вариантах осуществления способа он перед применением оценивающей модели ML дополнительно включает в себя выбор сервером нового цифрового элемента из множества новых цифровых элементов.

[029] В некоторых вариантах осуществления способа этот выбор включает в себя выбор нового цифрового элемента из множества новых цифровых элементов одним из следующих способов: (а) случайным образом, (б) с использованием равномерных вероятностей выбора, (в) с использованием значения вероятности выбора, пропорционального значению популярности нового цифрового элемента в данной области, и (г) с использованием значения вероятности выбора, пропорционального квадратному корню из значения популярности нового цифрового элемента в данной области.

[030] В некоторых вариантах осуществления способа этот выбор и применение выполняются итеративно в течение заранее заданного количества итераций перед формированием обучающего набора данных.

[031] В некоторых вариантах осуществления способа он дополнительно включает в себя обновление сервером обучающего цифрового объекта из множества обучающих цифровых объектов путем замены в нем указания на синтезированный пользовательский отклик указанием на пользовательский отклик, если сервер определил, что новый цифровой элемент из множества новых цифровых элементов получил пользовательский отклик.

[032] В некоторых вариантах осуществления способа оценивающая модель ML представляет собой модель ML матричной факторизации.

[033] В некоторых вариантах осуществления способа алгоритм MLA представляет собой алгоритм MLA на основе деревьев решений, алгоритм MLA на основе трансформера или алгоритм MLA на основе глубокого семантического сходства.

[034] Согласно второму аспекту настоящей технологии реализован способ формирования обучающего набора данных для обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы. Рекомендательная онлайн-платформа содержит множество цифровых элементов. Формирование обучающего набора данных включает в себя формирование синтезированных пользовательских откликов для новых цифровых элементов. Способ выполняется сервером, на котором размещена рекомендательная онлайн-платформа. Способ включает в себя: получение сервером указания на поставщика новых элементов из числа поставщиков новых элементов, имеющего множество новых цифровых элементов, подлежащих загрузке на рекомендательную онлайн-платформу, при этом новый цифровой элемент из множества новых цифровых элементов не имеет полученного ранее пользовательского отклика; получение сервером указания на множество поставщиков старых элементов, загрузивших множество старых цифровых элементов, по меньшей мере некоторые из которых получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы; анализ сервером поставщика новых элементов и множества поставщиков старых элементов с целью определения эталонного поставщика старых элементов на основе параметра сходства поставщика новых элементов с каждым из множества поставщиков старых элементов; основанное на пользовательских откликах, полученных множеством старых цифровых элементов эталонного поставщика старых элементов, определение сервером синтезированных пользовательских откликов для множества новых цифровых элементов поставщика новых элементов, включающее в себя определение сервером распределения откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов, и назначение сервером указаний на синтезированные пользовательские отклики множеству новых цифровых элементов поставщика новых элементов согласно распределению откликов для указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов; формирование сервером обучающего набора данных, содержащего множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и ввод сервером множества обучающих цифровых объектов в алгоритм MLA для обучения алгоритма MLA формированию рекомендаций цифровых элементов.

[035] Согласно третьему аспекту настоящей технологии реализован сервер для формирования обучающего набора данных с целью обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, размещенной на сервере. Рекомендательная онлайн-платформа содержит множество цифровых элементов. Множество цифровых элементов содержит (1) старую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу одним из множества поставщиков старых элементов, при этом по меньшей мере некоторые старые цифровые элементы из старой части цифровых элементов получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы, а указания на пользовательские отклики по меньшей мере некоторых старых цифровых элементов распределены в старой части цифровых элементов согласно распределению откликов, и (2) новую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу поставщиком новых элементов из множества поставщиков новых элементов и не имеет пользовательского отклика. Формирование включает в себя формирование синтезированных пользовательских откликов для новых цифровых элементов. Сервер содержит процессор и машиночитаемую физическую память, хранящую команды. Процессор при исполнении команд способен: на первом этапе - обучать оценивающую модель ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента путем получения указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом, и ввода множества цифровых объектов для оценивания в оценивающую модель ML и обучения таким образом оценивающей модели ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных; на втором этапе, следующем за первым - получать указание на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов, и применять оценивающую модель ML в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента; формировать обучающий набор данных, содержащий множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и вводить множество обучающих цифровых объектов в алгоритм MLA для обучения алгоритма MLA формированию рекомендаций цифровых элементов.

[036] В контексте настоящего описания термин «сервер» означает компьютерную программу, выполняемую соответствующими аппаратными средствами и способную принимать запросы (например, от электронных устройств) через сеть и выполнять эти запросы или инициировать их выполнение. Аппаратные средства могут представлять собой один физический компьютер или одну компьютерную систему, что не существенно для настоящей технологии. В настоящем контексте выражение «сервер» не означает, что каждая задача (например, принятая команда или запрос) или некоторая конкретная задача принимается, выполняется или запускается одним и тем же сервером (т.е. одними и теми же программными и/или аппаратными средствами). Это выражение означает, что любое количество программных средств или аппаратных средств может принимать, отправлять, выполнять или инициировать выполнение любой задачи или запроса либо результатов любых задач или запросов. Все эти программные и аппаратные средства могут представлять собой один сервер или несколько серверов, причем оба эти случая подразумеваются в выражении «по меньшей мере один сервер».

[037] В контексте настоящего описания термин «электронное устройство» означает любое компьютерное аппаратное средство, способное выполнять программы, подходящие для решения поставленной задачи. В контексте настоящего описания термин «электронное устройство» подразумевает, что устройство может функционировать в качестве сервера для других электронных устройств, тем не менее, это не обязательно для настоящей технологии. Таким образом, некоторые (не имеющие ограничительного характера) примеры электронных устройств включают в себя блок автономного вождения, персональные компьютеры (настольные, ноутбуки, нетбуки и т.п.), смартфоны и планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Должно быть понятно, что в настоящем контексте тот факт, что устройство функционирует в качестве электронного устройства, не означает, что оно не может функционировать в качестве сервера для других электронных устройств.

[038] В контексте настоящего описания выражение «информация» включает в себя информацию любого рода или вида, допускающую хранение в базе данных. Таким образом, информация включает в себя визуальные произведения (например, карты), аудиовизуальные произведения (например, изображения, фильмы, звукозаписи, презентации и т.д.), данные (например, данные о местоположении, метеорологические данные, данные о дорожном движении, числовые данные и т.д.), текст (например, мнения, комментарии, вопросы, сообщения и т.д.), документы, электронные таблицы и т.д., но не ограничивается ими.

[039] В контексте настоящего описания термин «база данных» означает любой структурированный набор данных, независимо от его конкретной структуры, программного обеспечения для управления базой данных или компьютерных аппаратных средств для хранения этих данных, их применения или обеспечения их использования иным способом. База данных может располагаться в тех же аппаратных средствах, где реализован процесс, обеспечивающий хранение или использование информации, хранящейся в базе данных, либо база данных может располагаться в отдельных аппаратных средствах, таких как специализированный сервер или множество серверов.

[040] В контексте настоящего описания числительные «первый», «второй», «третий» и т.д. используются лишь для указания на различие между существительными, к которым они относятся, но не для описания каких-либо определенных взаимосвязей между этими существительными. Кроме того, как встречается в настоящем описании в другом контексте, ссылка на «первый» элемент и «второй» элемент не исключает того, что эти два элемента в действительности могут быть одним и тем же элементом.

[041] Каждый вариант осуществления настоящей технологии относится к по меньшей мере одной из вышеупомянутых целей и/или к одному из вышеупомянутых аспектов, но не обязательно ко всем ним. Должно быть понятно, что некоторые аспекты настоящей технологии, связанные с попыткой достижения вышеупомянутой цели, могут не соответствовать этой цели и/или могут соответствовать другим целям, явным образом здесь не упомянутым.

[042] Дополнительные и/или альтернативные признаки, аспекты и преимущества вариантов осуществления настоящей технологии содержатся в дальнейшем описании, на приложенных чертежах и в формуле изобретения.

Краткое описание чертежей

[043] Эти и другие признаки, аспекты и преимущества настоящей технологии поясняются в дальнейшем описании, в приложенной формуле изобретения и на следующих чертежах.

[044] На фиг. 1 приведена схема иллюстративной компьютерной системы, которая может быть использована для реализации некоторых не имеющих ограничительного характера вариантов осуществления настоящей технологии.

[045] На фиг. 2 приведена схема сетевой вычислительной среды, содержащей компьютерную систему, представленную на фиг. 1, и пригодной для использования с некоторыми не имеющими ограничительного характера вариантами осуществления настоящей технологии.

[046] На фиг. 3 приведено схематическое изображение графического интерфейса пользователя (GUI, Graphical User Interface) рекомендательной онлайн-платформы, размещенной на сервере в сетевой вычислительной среде, представленной на фиг. 2, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[047] На фиг. 4A и 4Б приведены схематические изображения структуры входных и выходных данных оценивающей модели ML, которая используется сервером сетевой вычислительной среды, представленной на фиг. 2, для определения прогнозируемых указаний на пользовательские отклики для множества цифровых элементов рекомендательной онлайн-платформы, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[048] На фиг. 5 приведено схематическое изображение графа сходства поставщиков элементов для поставщиков множества цифровых элементов, размещенных на рекомендательной онлайн-платформе, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[049] На фиг. 6 приведено схематическое изображение шага для определения сходства нового и старого поставщиков элементов из множества цифровых элементов, размещенных на рекомендательной онлайн-платформе, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[050] На фиг. 7 приведена схема архитектуры модели машинного обучения, используемой для реализации по меньшей мере некоторых не имеющих ограничительного характера вариантов осуществления настоящей технологии.

[051] На фиг. 8 приведена схема первого способа формирования сервером из сетевой вычислительной среды, представленной на фиг. 2, обучающего набора данных для обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[052] На фиг. 9 приведена схема второго способа формирования сервером из сетевой вычислительной среды, представленной на фиг. 2, обучающего набора данных для обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

Осуществление изобретения

[053] Представленные здесь примеры и условный язык предназначены для обеспечения лучшего понимания принципов настоящей технологии, а не для ограничения ее объема до таких специально приведенных примеров и условий. Очевидно, что специалисты в данной области техники способны разработать различные способы и устройства, которые явно не описаны и не показаны, но реализуют принципы настоящей технологии в пределах ее существа и объема.

[054] Кроме того, чтобы способствовать лучшему пониманию, последующее описание может содержать упрощенные варианты реализации настоящей технологии. Специалистам в данной области должно быть понятно, что другие варианты осуществления настоящей технологии могут быть значительно сложнее.

[055] В некоторых случаях приводятся полезные примеры модификаций настоящей технологии. Они способствуют пониманию, но также не определяют объема или границ настоящей технологии. Представленный перечень модификаций не является исчерпывающим и специалист в данной области может разработать другие модификации в пределах объема настоящей технологии. Кроме того, если в некоторых случаях модификации не описаны, это не означает, что они невозможны и/или что описание содержит единственно возможный вариант реализации того или иного элемента настоящей технологии.

[056] Более того, описание принципов, аспектов и вариантов реализации настоящей технологии, а также их конкретные примеры предназначены для охвата их структурных и функциональных эквивалентов, независимо от того, известны они в настоящее время или будут разработаны в будущем. Например, специалистам в данной области техники должно быть понятно, что любые описанные здесь структурные схемы соответствуют концептуальным представлениям иллюстративных принципиальных схем, реализующих основы настоящей технологии. Также должно быть понятно, что любые блок-схемы, схемы процессов, диаграммы изменения состояния, псевдокоды и т.п. соответствуют различным процессам, которые могут быть представлены на машиночитаемом физическом носителе информации и могут выполняться компьютером или процессором, независимо от того, показан такой компьютер или процессор явно или нет.

[057] Функции различных элементов, показанных на чертежах, включая любой функциональный блок, обозначенный как «процессор», могут быть реализованы с использованием специализированных аппаратных средств, а также с использованием аппаратных средств, способных выполнять соответствующее программное обеспечение. Если используется процессор, эти функции могут выполняться одним выделенным процессором, одним совместно используемым процессором или множеством отдельных процессоров, некоторые из которых могут использоваться совместно. Кроме того, явное использование термина «процессор» или «контроллер» не должно трактоваться как указание исключительно на аппаратные средства, способные выполнять программное обеспечение, и может подразумевать, помимо прочего, аппаратные средства цифрового сигнального процессора (DSP), сетевой процессор, специализированную интегральную схему (ASIC), программируемую вентильную матрицу (FPGA), постоянное запоминающее устройство (ПЗУ) для хранения программного обеспечения, оперативное запоминающее устройство (ОЗУ) и/или энергонезависимое запоминающее устройство. Также могут подразумеваться другие аппаратные средства, общего назначения и/или заказные.

[058] Программные модули или просто модули, реализация которых предполагается в виде программных средств, могут быть представлены здесь как любое сочетание элементов блок-схемы или других элементов, указывающих на выполнение шагов процесса и/или содержащих текстовое описание. Такие модули могут выполняться аппаратными средствами, показанными явно или подразумеваемыми.

[059] Далее с учетом вышеизложенных принципов рассмотрены некоторые не имеющие ограничительного характера примеры, иллюстрирующие различные варианты реализации аспектов настоящей технологии.

Компьютерная система

[060] На фиг. 1 представлена компьютерная система 100, пригодная для использования в некоторых вариантах осуществления настоящей технологии. Компьютерная система 100 содержит различные аппаратные элементы, включая один или несколько одно- или многоядерных процессоров, обобщенно представленных процессором 110, графический процессор 111, твердотельный накопитель 120, ОЗУ 130, интерфейс 140 дисплея и интерфейс 150 ввода-вывода.

[061] Связь между различными элементами компьютерной системы 100 может осуществляться через одну или несколько внутренних и/или внешних шин 160, таких как шина PCI, шина USB, шина FireWire стандарта IEEE 1394, шина SCSI, шина Serial-ATA и т.д., с которыми различные аппаратные элементы соединены электронным образом.

[062] Интерфейс 150 ввода-вывода может соединяться с сенсорным экраном 190 и/или с одной или несколькими внутренними и/или внешними шинами 160. Сенсорный экран 190 может также называться экраном, например, экран (отдельно не обозначен) электронного устройства 210, представленного на фиг. 2. В представленных на фиг. 1 вариантах осуществления изобретения сенсорный экран 190 содержит сенсорные средства 194 (например, чувствительные к нажатию ячейки, встроенные в слой дисплея и позволяющие обнаруживать физическое взаимодействие между пользователем и дисплеем) и контроллер 192 сенсорных средств ввода-вывода, который обеспечивает связь с интерфейсом 140 дисплея и/или с одной или несколькими внутренними и/или внешними шинами 160. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии интерфейс 150 ввода-вывода может соединяться с клавиатурой (не показана), мышью (не показана) или сенсорной площадкой (не показана), которые обеспечивают взаимодействие пользователя с компьютерной системой 100 в дополнение к сенсорному экрану 190 или вместо него.

[063] Следует отметить, что в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии некоторые элементы компьютерной системы 100 могут отсутствовать. Например, могут отсутствовать клавиатура и мышь (отдельно не показаны), в частности, если компьютерная система 100 реализована в виде малогабаритного электронного устройства, такого как смартфон (но не ограничиваясь этим).

[064] Согласно вариантам осуществления настоящей технологии, твердотельный накопитель 120 хранит программные команды, пригодные для загрузки в ОЗУ 130 и выполнения процессором 110 и/или процессором 111 GPU. Программные команды могут, например, входить в состав библиотеки или приложения.

Сетевая вычислительная среда

[065] На фиг. 2 представлена схема сетевой вычислительной среды 200, пригодной для использования с некоторыми не имеющими ограничительного характера вариантами осуществления настоящей технологии. Сетевая вычислительная среда 200 содержит электронное устройство 210, соединенное через сеть 240 связи с сервером 250. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии электронное устройство 210 может быть связано с пользователем 220.

[066] В не имеющих ограничительного характера вариантах осуществления настоящей технологии электронное устройство 210 может представлять собой любые компьютерные аппаратные средства, способные выполнять программы, подходящие для решения поставленной задачи. Таким образом, в качестве некоторых не имеющих ограничительного характера примеров электронного устройства 210 можно привести персональные компьютеры (настольные, ноутбуки, нетбуки и т.п.), смартфоны и планшеты. Электронное устройство 210 может содержать некоторые или все элементы компьютерной системы 100, представленной на фиг. 1.

[067] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, на сервере 250 может быть размещена рекомендательная онлайн-платформа 260, которая может быть доступна процессору 110 электронного устройства 210 через сеть 240 связи. В общем случае рекомендательная онлайн-платформа 260 представляет собой веб-ресурс, обеспечивающий пользователю 220 доступ ко множеству 235 цифровых элементов, хранящихся в базе 230 данных, связанной с сервером 250 через соответствующую линию связи. Рекомендательная онлайн-платформа 260 может определять цифровые элементы, которые могут представлять интерес для пользователя 220, а затем передавать указания на такие цифровые элементы электронному устройству 210 для оценивания их пользователем.

[068] На реализацию рекомендательной онлайн-платформы 260 не накладывается каких-либо ограничений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии рекомендательная онлайн-платформа 260 может быть реализована в виде платформы потокового аудио, такой как платформа потокового аудио Sportify™, платформа потокового аудио Yandex.Music™, платформа потокового аудио YouTube.Music™ и т.д., а множество 235 цифровых элементов, хранящихся в базе 230 данных, может содержать различные фонограммы, такие как песни, подкасты, аудиокниги и т.п. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии рекомендательная онлайн-платформа может быть реализована в виде платформы потокового видео, такой как платформа потокового видео Netflix™, платформа потоковой передачи Amazon™ Prime Video и т.д., а множество 235 цифровых элементов может, например, содержать видеоклипы, фильмы и телевизионные программы. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии рекомендательная онлайн-платформа 260 может быть реализована в виде платформы онлайн-списков, такой как платформа онлайн-списков Yandex.Market™ или платформа онлайн-списков Amazon™, а множество 235 цифровых элементов может содержать рубрицированные списки различных товаров и услуг, доступных для онлайн-покупки. Также возможны и другие варианты реализации рекомендательной онлайн-платформы 260 без выхода за границы настоящей технологии.

[069] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может быть реализован в виде традиционного компьютерного сервера и может содержать некоторые или все элементы компьютерной системы 100, представленной на фиг. 1. В одном не имеющем ограничительного характера примере сервер 250 реализован в виде сервера Dell™ PowerEdge™, работающего под управлением операционной системы Microsoft™ Windows Server™, но он также может быть реализован с использованием любых других подходящих аппаратных средств, прикладного программного обеспечения и/или встроенного программного обеспечения либо их сочетания. В представленных не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 представляет собой один сервер. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии (не показаны) функции сервера 250 могут быть распределены между несколькими серверами.

[070] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может эксплуатироваться организацией, управляющей рекомендательной онлайн-платформой 260. Например, если рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио Yandex.Music™, то сервер 250 также может эксплуатироваться компанией ООО «Яндекс» (ул. Льва Толстого, 16, Москва, 119021, Россия). В альтернативных не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может эксплуатироваться организацией, отличной от той, что предоставляет рекомендательную онлайн-платформу 260.

[071] Например, с использованием электронного устройства 210 пользователь 220 может осуществлять доступ к рекомендательной онлайн-платформе 260 с электронного устройства 210. Кроме того, пользователь 220 может отправлять запрос 215 рекомендации серверу 250. В ответ сервер 250 может (а) определять набор 225 рекомендуемых цифровых элементов и (б) отправлять указания на набор 225 рекомендуемых цифровых элементов электронному устройству для представления пользователю 220. На способ отправки запроса 215 рекомендации пользователем 220 не накладывается ограничений.

Сеть связи

[072] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сеть 240 связи представляет собой сеть Интернет. В альтернативных не имеющих ограничительного характера вариантах осуществления настоящей технологии сеть 240 связи может быть реализована в виде любой подходящей локальной сети (LAN, Local Area Network), глобальной сети (WAN, Wide Area Network), частной сети связи и т.п. Должно быть понятно, что варианты осуществления сети связи приведены лишь в иллюстративных целях. Реализация соответствующих линий связи (отдельно не обозначены) между электронным устройством 210 и сервером 250 с одной стороны и сетью 240 связи с другой стороны зависит, среди прочего, от реализации электронного устройства 210 и сервера 250. Лишь в качестве не имеющего ограничительного характера примера, в тех вариантах осуществления настоящей технологии, где электронное устройство 210 реализовано в виде устройства беспроводной связи, такого как смартфон, линия связи может быть реализована в виде беспроводной линии связи. Примеры беспроводных линий связи включают в себя канал сети связи 3G, канал сети связи 4G и т.д. В сети 240 связи также может использоваться беспроводное соединение с сервером 250.

Рекомендательная платформа

[073] На фиг. 3 представлен графический интерфейс 300 пользователя (GUI) рекомендательной онлайн-платформы 260, отображаемый на электронном устройстве 210, связанном с пользователем 220, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[074] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может инициировать отображение электронным устройством 210 интерфейса 300 GUI в ответ на отправку пользователем 220 запроса на доступ к рекомендательной онлайн-платформе 260, например, путем ввода универсального указателя ресурсов (URL, Universal Resource Locator) сервера 250 в браузерное приложение (отдельно не показано) электронного устройства 210 или путем запуска в нем приложения (отдельно не обозначено на фиг. 3), связанного с рекомендательной онлайн-платформой 260.

[075] Предполагается, что в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии интерфейс 300 GUI может содержать по меньшей мере следующее: (а) указания на по меньшей мере часть набора 225 рекомендуемых цифровых элементов, которая, например, зависит от размеров экрана электронного устройства 210; (б) указание на представляемый в текущий момент времени рекомендуемый цифровой элемент 302; (в) элементы 304 управления, с помощью которых пользователь 220 может управлять представлением рекомендуемого цифрового элемента; и (г) элементы 306 управления обратной связью, с помощью которых пользователь 220 может оставлять свой отклик для рекомендуемого цифрового элемента из набора 225 рекомендуемых цифровых элементов, такого как представляемый в текущий момент времени рекомендуемый цифровой элемент 302.

[076] Несмотря на то, что вариантах осуществления изобретения согласно фиг. 3 интерфейс 300 GUI представляет рекомендательную онлайн-платформу 260, реализованную в виде платформы потокового аудио, должно быть понятно, что в других не имеющих ограничительного характера вариантах осуществления настоящей технологии подобные интерфейсы GUI могут отображаться для рекомендательных онлайн-платформ 260 других видов, некоторые из которых указаны выше.

[077] На способ отправки из электронного устройства 210 запроса 215 рекомендации относительно набора 225 рекомендуемых цифровых элементов не накладывается ограничений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии пользователь 220 может явным образом отправлять запрос 215 рекомендации серверу 250, например, с помощью специального элемента управления интерфейса 300 GUI (такого как «Play Radio» («Включить радио») (не показан на фиг. 3) в примере, где рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио). В других не имеющих ограничительного характера вариантах осуществления настоящей технологии запрос 215 рекомендации может быть инициирован пользователем 220, который обращается к рекомендательной онлайн-платформе 260 с электронного устройства 210, запуская интерфейс 300 GUI. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии запрос 215 рекомендации может быть инициирован пользователем 220, оценивающим цифровой элемент из множества 235 цифровых элементов.

[078] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может формировать набор 225 рекомендуемых цифровых элементов для пользователя 220 по меньшей мере на основе значения популярности элемента каждого цифрового элемента из множества 235 цифровых элементов, как более подробно описано ниже. Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять значение популярности элемента для цифрового элемента из множества 235 цифровых элементов, размещенных на рекомендательной онлайн-платформе 260, на основе пользовательских действий пользователей рекомендательной онлайн-платформы 260, таких как пользователь 220, с этим цифровым элементом. Например, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии такие пользовательские действия могут включать в себя размещение, например, с использованием элементов 306 управления обратной связью, пользовательского отклика под цифровым элементом.

[079] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, интерфейс 300 GUI рекомендательной онлайн-платформы 260 может содержать элементы 306 управления обратной связью, позволяющие указывать пользовательский отклик с помощью двоичных значений, таких как «Like» («Нравится») или «Dislike» («Не нравится»), соответственно, указывающих на положительное или отрицательное пользовательское действие пользователя 220 с цифровым элементом. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии элементы 306 управления обратной связью могут содержать другую конфигурацию, например, индикаторы в виде звезд, указатели эмоций и т.п. (не показаны), обеспечивающую указание пользовательского отклика с использованием одного значения из заранее заданного диапазона значений, например, от 1 до 5 или от 1 до 10, где значение 1 указывает на отрицательное пользовательское действие пользователя 220 с цифровым элементом, а значение 5 или 10, соответственно, указывает на положительное пользовательское действие пользователя 220 с цифровым элементом.

[080] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значение популярности элемента на основе других пользовательских действий пользователя 220 с цифровым элементом, которые, подобно пользовательскому отклику, также могут указывать на положительное или отрицательное пользовательское действие с цифровым элементом. Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, такие другие пользовательские действия пользователя 220, указывающие на положительное пользовательское действие с цифровым элементом, могут включать в себя: (а) выбор цифрового элемента для оценивания; (б) поиск цифрового элемента на рекомендательной онлайн-платформе 260; (в) использование функции «поделиться» для цифрового элемента через учетные записи пользователя 220 в социальных сетях; (г) включение повтора представления цифрового элемента; (д) добавление цифрового элемента в список избранных цифровых элементов пользователя 220 и т.п.

[081] Пользовательские действия пользователя 220, указывающие на отрицательное пользовательское действие с цифровым элементом из множества 235 цифровых элементов, могут, среди прочего, включать в себя: (а) пропуск части цифрового элемента; (б) пропуск всего цифрового элемента и переход к следующему цифровому элементу; (в) прерывание представления цифрового элемента с последующим поиском другого цифрового элемента для оценивания и т.п. Также возможны другие пользовательские действия пользователя 220, указывающие на положительное и отрицательное пользовательское действие с цифровым элементом, без выхода за границы настоящей технологии.

[082] Таким образом, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, в ответ на получение запроса 215 рекомендации от электронного устройства 210 сервер 250 на основе по меньшей мере указаний на пользовательские отклики может (а) определять значение популярности элемента для каждого элемента из множества 235 цифровых элементов и (б) определять на основе значений популярности элементов из множества 235 цифровых элементов набор 225 рекомендуемых цифровых элементов для предоставления пользователю 220, как это описано выше. Например, рекомендуемый цифровой элемент из набора 225 рекомендуемых цифровых элементов может представлять собой один из наиболее популярных цифровых элементов из множества 235 цифровых элементов. В другом примере сервер 250 может определять в качестве рекомендуемого цифрового элемента цифровой элемент, предоставленный поставщиком элементов, связанным с по меньшей мере одним из наиболее популярных цифровых элементов. В другом примере сервер 250 может определять в качестве рекомендуемого цифрового элемента для пользователя 220 цифровой элемент, наиболее популярный среди пользователей, схожих с пользователем 220, исходя из заранее заданных пользовательских признаков.

[083] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять набор 225 рекомендуемых цифровых элементов так, чтобы максимизировать значение вероятности положительного пользовательского действия пользователя 220 с каждым элементом из набора 225 рекомендуемых цифровых элементов, на которое указывает, например, положительный пользовательский отклик. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять набор 225 рекомендуемых цифровых элементов так, чтобы минимизировать значение вероятности отрицательного пользовательского действия пользователя 220 с каждым элементом из набора 225 рекомендуемых цифровых элементов, на которое указывает, например, отрицательный пользовательский отклик.

[084] В частности, с этой целью в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять для набора 225 рекомендуемых цифровых элементов рекомендуемые цифровые элементы с признаками элемента, подобными признакам тех цифровых элементов, с которыми пользователь 220 совершал наиболее положительные пользовательские действия, как это описано выше. В другом примере сервер 250 может определять для включения в набор 225 рекомендуемых цифровых элементов рекомендуемые цифровые элементы из числа элементов с положительными пользовательскими действиями со стороны других пользователей рекомендательной онлайн-платформы 260 с пользовательскими признаками, схожими с признаками пользователя 220.

[085] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, признаки элемента, связанные с цифровым элементом, могут указывать на его собственные параметры, которые предположительно могут зависеть от характера цифрового элемента. Например, в тех вариантах осуществления изобретения, где рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио, а цифровой элемент представляет собой фонограмму, признаки элемента, могут, среди прочего, включать в себя: (а) жанр фонограммы; (б) заранее заданное настроение, вызываемое фонограммой; (в) период популярности, связанный с фонограммой, например, шестидесятые годы, семидесятые годы, девяностые годы и т.п.; (г) поставщика фонограммы, например, исполнителя, продюсера, звукозаписывающую студию и т.п.; (д) продолжительность фонограммы; (е) дату выпуска фонограммы; (ж) ритм фонограммы; (з) альбом фонограммы и т.п.

[086] Пользовательские признаки пользователя рекомендательной онлайн-платформы 260, такого как пользователь 220, могут, среди прочего, включать в себя: (а) социально-демографические характеристики пользователя 220, включая возраст пользователя 220, пол пользователя 220, статус занятости пользователя 220, средний доход пользователя 220 и т.п.; (б) данные, указывающие на историю поиска пользователя 220; (в) данные, указывающие на историю просмотра веб-страниц пользователя 220 и т.п.

[087] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии для определения набора 225 рекомендуемых цифровых элементов для пользователя 220, как это описано выше, сервер 250 может выполнять алгоритм 280 MLA, обученный определению рекомендуемых цифровых элементов на основе вышеупомянутых признаков для каждого пользователя рекомендательной онлайн-платформы 260. В частности, выполняемый алгоритм 280 MLA может быть обучен определению значений вероятности положительного действия пользователя 220 с каждым элементом из множества 235 цифровых элементов, такого как формирование для него пользователем 220 положительного пользовательского отклика. Кроме того, сервер 250 может (а) ранжировать цифровые элементы согласно соответствующим значениям вероятности и (б) выбирать N цифровых элементов с наибольшим рангом, например, 100, 500 или 1000, для включения в набор 225 рекомендуемых цифровых элементов.

[088] Как более подробно описано ниже, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может обучать алгоритм 280 MLA на основе обучающего набора данных, содержащего множество обучающих цифровых объектов, каждый из которых может, среди прочего, содержать: (а) указание на цифровой элемент из множества 235 цифровых элементов; (б) признаки элемента для цифрового элемента; (в) указания на прошлые пользовательские действия пользователей рекомендательной онлайн-платформы 260 с цифровым элементом, такие как пользовательский отклик, предоставленный для текущего цифрового элемента, как это описано выше; (г) пользовательские признаки пользователей, взаимодействовавших с цифровым элементом, например, оставивших под ним свои пользовательские отклики.

[089] Таким образом, путем определения и предоставления рекомендуемых цифровых элементов пользователям рекомендательной онлайн-платформы 260, сервер 250 может: (а) представлять различные цифровые элементы пользователям; (б) получать их пользовательские отклики для рекомендуемых цифровых элементов; (в) повышать точность последующих рекомендаций на основе пользовательских откликов. Предполагается, что благодаря такому предоставлению рекомендуемых элементов может быть повышена удовлетворенность (а) пользователей за счет предоставления им представляющих для них интерес цифровых элементов и (б) поставщиков элементов вследствие более полного представления их различных цифровых элементов пользователям рекомендательной онлайн-платформы 260.

[090] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, множество 235 цифровых элементов, размещенных на рекомендательной онлайн-платформе 260, может содержать (а) старую часть 255 цифровых элементов, загруженных на рекомендательную онлайн-платформу 260 множеством 245 поставщиков старых элементов с помощью их электронных устройств (отдельно не обозначены), и (б) новую часть 275 цифровых элементов, загруженных на рекомендательную онлайн-платформу 260 множеством 265 поставщиков новых элементов с помощью их электронных устройств (отдельно не обозначены).

[091] В контексте настоящего описания термин «поставщик элементов» в целом означает некое лицо, например, частное лицо, музыканта или музыкального продюсера, или организацию, например, студию музыкальной звукозаписи, имеющее множество цифровых элементов, загруженных на рекомендательную онлайн-платформу 260 для совместного доступа к ним пользователей.

[092] Кроме того, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, старый цифровой элемент из старой части 255 цифровых элементов означает цифровой элемент, который был доступен на рекомендательной онлайн-платформе 260 дольше, чем заранее заданное пороговое значение периода доступности, например, такое как одна неделя, один месяц или один год. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии старые цифровые элементы могут представлять собой цифровые элементы, получившие по меньшей мере одно указание на пользовательский отклик по меньшей мере одного пользователя рекомендательной онлайн-платформы 260. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии старый цифровой элемент может представлять собой цифровой элемент, предоставленный поставщиком из множества 245 поставщиков старых элементов, который присутствует на рекомендательной онлайн-платформе 260 дольше, чем заранее заданное пороговое значение времени присутствия, которое, например, может соответствовать месяцу, кварталу или году. Таким образом, в по меньшей мере некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии по меньшей мере некоторые элементы из множества 257 старых цифровых элементов, загруженных на рекомендательную онлайн-платформу 260 поставщиком 247 старых элементов, получили по меньшей мере одно указание на пользовательский отклик от по меньшей мере одного пользователя.

[093] В контексте настоящего описания, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, новый цифровой элемент из новой части 275 цифровых элементов представляет собой цифровой элемент, который не имеет указаний на пользовательские действия с ним, включая пользовательский отклик, например, потому, что (а) был доступен на рекомендательной онлайн-платформе 260 меньше заранее заданного порогового значения периода доступности или (б) был загружен поставщиком из множества 265 поставщиков новых элементов, который неизвестен пользователям рекомендательной онлайн-платформы 260 (непопулярен). Например, множество 277 новых цифровых элементов поставщика 267 новых элементов может стать доступным на рекомендательной онлайн-платформе 260 в результате расширения области обслуживания рекомендательной онлайн-платформы 260 на новую географическую территорию, поставщики элементов с которой ранее не присутствовали на рекомендательной онлайн-платформе 260.

[094] Поскольку каждый элемент из множества 277 новых цифровых элементов не имеет пользовательского отклика или имеет лишь очень ограниченный пользовательский отклик, сервер 250 впоследствии может оказаться неспособным определять значения популярности элементов для каждого элемента из множества 277 новых цифровых элементов, а алгоритм 280 MLA, обученный определению рекомендуемых цифровых элементов на основе, среди прочего, значений популярности элементов из множества 235 цифровых элементов, может игнорировать множество 277 новых цифровых элементов поставщика 267 новых элементов. Таким образом, элементы из множества 277 новых цифровых элементов могут оказаться не включенными в набор 225 рекомендуемых цифровых элементов.

[095] Соответственно, такая «пессимизация» множества 277 цифровых элементов при составлении набора 225 рекомендуемых цифровых элементов может привести к тому, что пользователь 220 не обнаружит релевантных рекомендуемых цифровых элементов и, следовательно, новый поставщик 267 элементов потеряет свою целевую аудиторию.

[096] Один из простейших подходов к решению этой проблемы разреженности данных заключается в получении значений популярности элементов для каждого нового цифрового элемента из новой части 275 цифровых элементов на основе корреляции между его признаками элемента и признаками элемента каждого старого цифрового элемента из старой части 255 цифровых элементов. Тем не менее, вследствие потенциально большого количества различных признаков элементов и количества самих цифровых элементов такой анализ может представлять собой задачу, требующего очень больших затрат ресурсов процессора 110 сервера 250.

[097] Разработчики настоящей технологии установили, что указание на пользовательский отклик может быть определено непосредственно для каждого нового цифрового элемента из новой части 275 цифровых элементов на основе указаний на пользовательские отклики, распределенные в старой части 255 цифровых элементов. В частности, настоящие способы и системы предназначены для назначения цифровым элементам из новой части 275 цифровых элементов указаний на синтезированный пользовательский отклик, который, в отличие от фактического пользовательского отклика, не был предоставлен пользователями рекомендательной онлайн-платформы 260, а был определен сервером 250. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии настоящие способы включают в себя обучение алгоритма определению значений вероятности предоставления пользователями рекомендательной онлайн-платформы 260 указаний на пользовательские отклики (как положительные, так и отрицательные) для цифровых элементов из новой части 275 цифровых элементов на основе распределения указаний на пользовательские отклики в старой части 255 цифровых элементов.

[098] Новые цифровые элементы из новой части 275 цифровых элементов, получившие указания на синтезированные пользовательские отклики, могут рассматриваться алгоритмом 280 MLA в процессе определения рекомендуемых цифровых элементов для пользователя 220, что обеспечивает возможность представления новых цифровых элементов пользователям рекомендательной онлайн-платформы 260. Соответственно, как описано выше, в результате возможна взаимная польза для пользователей и для множества 265 поставщиков новых элементов рекомендательной онлайн-платформы 260, поскольку первые могут обнаруживать новые представляющие для них интерес релевантные цифровые элементы, а последние могут расширять свою целевую аудиторию.

[099] Ниже со ссылкой на фиг. 4-6 подробно описан возможный анализ распределения указаний на пользовательские отклики в старой части 255 цифровых элементов с целью определения указаний на синтезированные отклики для новых цифровых элементов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

Оценивающая модель ML

[0100] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, для определения указаний на синтезированные пользовательские отклики для каждого нового цифрового элемента из новой части 275 цифровых элементов, как это описано выше, сервер 250 сначала может на основе указаний на пользовательские отклики, полученные для некоторых элементов из старой части 255 цифровых элементов, обучать оценивающую модель ML определению прогнозируемых указаний на пользовательские отклики для цифровых элементов, таких как элементы из старой части 255 цифровых элементов, не имеющие указаний на пользовательские отклики. На реализацию оценивающей модели ML не накладывается ограничений. Тем не менее, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии оценивающая модель ML может быть реализована в виде модели ML матричной факторизации.

[0101] На фиг. 4A и 4Б представлены схематические изображения входной матрицы 402 и выходной матрицы 404 модели ML матричной факторизации согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[0102] Предполагается, что входная матрица 402 имеет размер m*n, где m - количество пользователей рекомендательной онлайн-платформы 260, n - количество старых цифровых элементов в старой части 255 цифровых элементов. Таким образом, элемент входной матрицы 402 содержит: (а) фактическое указание 406 на пользовательский отклик, например, «Like» («Нравится») или «Dislike» («Не нравится»), как это описано выше, предоставленный пользователем, таким как пользователь 220, для старого цифрового элемента из старой части 255 цифровых элементов; (б) признаки элемента для старого цифрового элемента; и (в) пользовательские признаки пользователя 220, сформировавшего фактическое указание 406 под старым цифровым элементом.

[0103] В общем случае модель матричной факторизации представляет собой модель ML векторных представлений, которая может быть обучена, например, сервером 250, определению матрицы P векторных представлений пользователей (например, пользователей рекомендательной онлайн-платформы 260) и матрицы Q векторных представлений элементов (например, элементов из старой части 255 цифровых элементов) таких, что выходная матрица 404, определенная как PQ ^T, аппроксимирует входную матрицу 402 с требуемым уровнем достоверности. В частности, строка матрицы Q векторных представлений элементов содержит латентные признаки элемента для элемента из старой части 255 цифровых элементов, представляющие его фактические признаки элемента, а строка матрицы P векторных представлений пользователей содержит латентные признаки пользователя, например, пользователя 220, которые указывают на степень заинтересованности пользователя 220 в элементе с такими фактическими признаками элемента из старой части 255 цифровых элементов.

[0104] В этой связи сервер 250 может (а) формировать целевую функцию (также известную в данной области техники как функция потерь), указывающую на различия между соответствующими элементами входной и выходной матриц 402, 404, и (б) путем минимизации целевой функции определять элементы матриц P и Q векторных представлений пользователей и элементов. Например, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии целевая функция может представлять собой целевую функцию среднеквадратичной ошибки, которая может быть представлена следующим уравнением:

где - элемент входной матрицы 402, - соответствующий элемент выходной матрицы 404, - соответствующий элемент матрицы P векторных представлений пользователей, - соответствующий элемент матрицы Q векторных представлений элементов.

[0105] Следовательно, путем минимизации целевой функции, например, с использованием способа градиентного спуска, сервер 250 может определять элементы матрицы P векторных представлений пользователей и матрицы Q векторных представлений элементов. На основе определенных таким образом матриц P и Q векторных представлений пользователей и векторных представлений элементов сервер 250 может определять элементы выходной матрицы 404, схематически представленной на фиг. 4Б. Как показано в выходной матрице 404, на основе сходства признаков элемента и пользователя, связанных с элементами из старой части 255 цифровых элементов, имеющими фактические указания на пользовательские отклики, обученная таким образом модель ML матричной факторизации способна: (а) определять для элемента из старой части 255 цифровых элементов, который ранее не имел указания на пользовательский отклик, прогнозируемое указание 408 на пользовательский отклик; и (б) аппроксимировать имеющиеся фактические указания на пользовательские отклики для элементов из старой части 255 цифровых элементов, которые их имели, например, для старого цифрового элемента, связанного с фактическим указанием 406 на пользовательский отклик.

[0106] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии для определения указаний на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов сервер 250 может (а) увеличивать размер входной матрицы 402 путем добавления в нее столбцов, указывающих на элементы из новой части 275 цифровых элементов; (б) повторно определять матрицы P и Q векторных представлений пользователей и векторных представлений элементов; и (в) формировать обновленную версию выходной матрицы 404, которая, таким образом, содержит указания на синтезированные пользовательские отклики, которые представляют собой прогнозируемые указания на пользовательские отклики для каждого элемента из новой части 275 цифровых элементов.

[0107] Должно быть понятно, что помимо описанной выше модели матричной факторизации, для реализации оценивающей модели ML могут использоваться и другие архитектуры ML, включая, среди прочего, модель ML на основе деревьев решений, модель ML на основе нейронной сети и т.д.

[0108] При этом, как описано выше, определение связей между пользовательскими признаками и признаками элемента для каждого элемента из новой части 275 цифровых элементов путем повторного обучения модели ML может представлять собой задачу для сервера 250, требующую значительных ресурсов. Кроме того, признаки элемента для некоторых элементов из новой части 275 цифровых элементов могут быть недоступными.

[0109] В этой связи в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может с использованием прогнозов оценивающей модели ML обучать алгоритм формирования синтезированных пользовательских откликов, способный формировать указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов на основе разреженных входных данных, например, без учета признаков элемента из новой части 275 цифровых элементов. В частности, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, алгоритм формирования синтезированных пользовательских откликов может определять указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов так, чтобы они распределялись в новой части 275 цифровых элементов согласно распределению откликов для прогнозируемых указаний на отклики в старой части 255 цифровых элементов. Иными словами, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов с использованием распределения откликов прогнозируемых указаний на отклики в старой части 255 цифровых элементов в качестве фактических данных.

[0110] В общем случае распределение откликов представляет распределение прогнозируемых указаний на положительные и отрицательные пользовательские отклики в старой части 255 цифровых элементов. Тем не менее должно быть понятно, что в других не имеющих ограничительного характера вариантах осуществления настоящей технологии в распределении откликов могут учитываться только фактические указания на пользовательские отклики, предоставленные для некоторых элементов из старой части 255 цифровых элементов пользователями рекомендательной онлайн-платформы 260.

[0111] Таким образом, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять распределение откликов путем определения его конкретных параметров, например, в числе прочего, по меньшей мере одного из следующих: математическое ожидание, среднеквадратическое отклонение, коэффициент асимметрии и крутизна распределения откликов. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять распределение откликов с использованием его графического представления.

[0112] В результате могут быть уменьшены затраты вычислительных ресурсов на сервере 250 для определения указаний на синтезированные пользовательские отклики и новые цифровые элементы могут быть более эффективно представлены пользователям рекомендательной онлайн-платформы 260.

[0113] Ниже описано, как сервер 250 может обучать алгоритм формирования синтезированного отклика с учетом распределения откликов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

Алгоритм формирования синтезированных пользовательских откликов. Этап обучения

[0114] Согласно некоторым не имеющим ограничительного характера вариантах осуществления настоящей технологии, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов определению указаний на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов на основе старой части 255 цифровых элементов.

[0115] В частности, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов так, чтобы с учетом конкретного подхода к выбору старых цифровых элементов из старой части 255 цифровых элементов алгоритм формирования синтезированных пользовательских откликов был способен: (а) определять для старого цифрового элемента, такого как элемент из множества 257 старых цифровых элементов, связанного со поставщиком 247 старых элементов, значение вероятности получения старым цифровым элементом, например, положительного пользовательского отклика; и (б) назначать на основе этого значения вероятности указание на синтезированный пользовательский отклик для старого цифрового элемента так, чтобы указания на синтезированные пользовательские отклики были распределены во множестве 257 старых цифровых элементов согласно распределению откликов, как это описано выше.

[0116] Например, сервер 250 может назначать указание на синтезированный пользовательский отклик для старого цифрового элемента на основе значения вероятности, связанного с ним, и конкретных порогов вероятности. В частности, если значение вероятности больше заранее заданного верхнего порога вероятности (например, такого как 0,75, 0,80 или 0,9), сервер 250 может назначить для старого цифрового элемента указание на положительный синтезированный пользовательский отклик, а если значение вероятности меньше заранее заданного нижнего порога вероятности (например, такого как 0,1, 0,25 или 0,4), сервер 250 может назначить для старого цифрового элемента указание на отрицательный синтезированный пользовательский отклик. Кроме того, если значение вероятности равно заранее заданному верхнему порогу вероятности (например, такому как 0,75, 0,80 или 0,9), сервер 250 может назначить для старого цифрового элемента указание на то, что старый цифровой элемент был оценен.

[0117] Путем обучения алгоритма формирования синтезированных пользовательских откликов, как это описано выше, сервер 250 может определять его конкретные параметры этапа использования, как это описано ниже. Затем сервер 250 может применять алгоритм формирования синтезированных пользовательских откликов с определенными таким образом его параметрами этапа использования в отношении новой части 275 цифровых элементов.

[0118] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, поскольку признаки элемента для новой части 275 цифровых элементов могут быть недоступными, сервер 250 может определять другие признаки для старой части 255 цифровых элементов с целью обучения алгоритма формирования синтезированных пользовательских откликов. В частности, некоторые не имеющие ограничительного характера варианты осуществления настоящей технологии основаны на предположении, что сходство старого цифрового элемента из старой части 255 цифровых элементов и нового цифрового элемента из новой части 275 цифровых элементов может быть определено не только на основе признаков элемента, но и на основе сходства поставщиков старого и нового элементов, а также конкретных признаков, указывающих на популярность элемента, которая связана с новой частью 275 цифровых элементов и может быть получена на основе данных за пределами рекомендательной онлайн-платформы 260.

[0119] Таким образом, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может представлять значение вероятности как содержащее (а) первое значение вероятности, определенное на основе оценки сходства поставщика старых элементов, связанного со старым цифровым элементом, и множества 245 поставщиков старых элементов, и/или (б) второе значение вероятности, определенное на основе значения параметра популярности, связанного со старым цифровым элементом.

[0120] Ниже описан способ определения сервером 250 первого и второго значений вероятности с учетом распределения откликов для прогнозируемых указаний на пользовательские отклики в старой части 255 цифровых элементов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[0121] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 (см. фиг. 2) может определять первое значение вероятности получения старым цифровым элементом указания на положительный пользовательский отклик на основе оценки сходства поставщика 247 старых элементов, загрузившего этот старый цифровой элемент на рекомендательную онлайн-платформу 260, и множества 245 поставщиков старых элементов согласно следующей формуле:

, (2)

где artistScore - оценка сходства поставщика 247 старых элементов со множеством 245 поставщиков старых элементов, a и b - коэффициенты.

[0122] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, коэффициенты a и b представляют собой параметры из числа параметров этапа использования для алгоритма формирования синтезированных пользовательских откликов. Как более подробно описано ниже, сервер 250 может определять эти коэффициенты с использованием распределения откликов в качестве фактических данных. Иными словами, сервер 250 может определять коэффициенты a и b так, чтобы указания на синтезированные пользовательские отклики, определенные для элементов из старой части 255 цифровых элементов на основе по меньшей мере их первых значений вероятности, были распределены в старой части 255 цифровых элементов согласно распределению откликов для прогнозируемых указаний на пользовательские отклики в старой части 255 цифровых элементов, определенных оценивающей моделью ML, как это описано выше.

[0123] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять оценку сходства для поставщика 247 старых элементов на основе значений параметра сходства каждого поставщика из множества 245 поставщиков старых элементов с поставщиком 247 старых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии такой параметр сходства может содержать степень сходства поставщика 247 старых элементов и другого поставщика из множества 245 поставщиков старых элементов.

[0124] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сходство поставщика 247 старых элементов и другого поставщика из множества поставщиков старых элементов может быть определено на основе по меньшей мере одного связанного с ним признака поставщика элементов. Например, в тех вариантах осуществления изобретения, где рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио, а старый поставщик 247 элементов представляет собой музыканта, признаки поставщика элементов для поставщика 247 старых элементов могут, среди прочего, включать в себя: (а) жанр, в котором работает музыкант; (б) количество альбомов, выпущенных музыкантом; (в) язык, используемый музыкантом; (г) период популярности, связанный с музыкантом; (д) количество потоков для песен музыканта на рекомендательной онлайн-платформе 260; (е) возрастная группа целевой аудитории музыканта; (ж) количество пользователей рекомендательной онлайн-платформы 260, оставивших по меньшей мере одно указание на положительный или отрицательный пользовательский отклик под песнями музыканта; (з) по меньшей мере один пользовательский признак пользователя рекомендательной онлайн-платформы 260, оставившего по меньшей мере одно указание на положительный или отрицательный пользовательский отклик под песнями музыканта, и т.д.

[0125] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять сходство поставщика 247 старых элементов и другого поставщика из множества 245 поставщиков старых элементов путем: (а) формирования для каждого поставщика из множества 245 поставщиков старых элементов вектора признаков поставщика элементов; (б) отображения векторов признаков в многомерное векторное пространство; и (в) определения в многомерном векторном пространстве значения расстояния между векторами признаков поставщиков элементов, представляющими поставщика 247 старых элементов и другого поставщика из множества 245 поставщиков старых элементов. Таким образом, в примере, где поставщик старых элементов представляет собой музыканта, векторы признаков поставщиков элементов музыкантов, использующих один язык или языки одной языковой группы, расположены ближе друг к другу в многомерном векторном пространстве, чем векторы музыкантов, использующих разные языки. В другом примере векторы признаков поставщиков элементов музыкантов, песни которых получили указания на положительный пользовательский отклик от пользователей одной возрастной группы, расположены ближе друг к другу в многомерном векторном пространстве, чем векторы музыкантов, песни которых оценены пользователями разных возрастных групп.

[0126] На основе значений расстояния между поставщиком 247 старых элементов и каждым другим поставщиком из множества 245 поставщиков старых элементов сервер 250 может ранжировать каждого поставщика из множества 245 поставщиков старых элементов относительно поставщика 247 старых элементов и определять таким образом значения параметра сходства между ним и поставщиком 247 старых элементов.

[0127] Кроме того, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, для определения оценки сходства поставщика 247 старых элементов сервер 250 может формировать графовую структуру на основе значений параметра сходства. На фиг. 5 приведено схематическое изображение графа 500 сходства поставщиков элементов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[0128] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может формировать граф 500 сходства поставщиков элементов таким образом, что (а) его вершина, такая как первая вершина 502, представляет поставщика старых элементов из множества 245 поставщиков старых элементов, а (б) ребро 506, соединяющее первую вершину 502 и вторую вершину 504, указывает на ненулевое значение параметра сходства между ними, определенного, как это описано выше. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии граф 500 сходства поставщиков элементов может представлять собой ориентированный граф, ребра которого имеют ориентацию, указывающую на то, относительно какого поставщика старых элементов определено значение параметра сходства.

[0129] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может на основе значений параметра сходства для множества 245 поставщиков старых элементов определять весовые значения переходов между вершинами графа 500 сходства поставщиков элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять весовое значение перехода для пары вершин графа 500 сходства поставщиков элементов как обратно пропорциональное значениям параметра сходства между поставщиками старых элементов, расположенными на этом переходе. В случаях, когда пара вершин соединена ребром, например, первая и вторая вершины 502, 504, соединенные ребром 506, сервер 250 может определять весовое значение перехода от второй вершины 504 к перовой вершине 502 как значение, обратно пропорциональное значению параметра сходства между поставщиками старых элементов, связанными с первой и второй вершинами 502, 504. В другом примере, где пара вершин не имеет непосредственной связи через одно ребро, например, третья вершина 508 и четвертая вершина 510, но имеется переход через пятую вершину 512, сервер 250 может определять весовое значение перехода от третьей вершины 508 к четвертой вершине 510 как значение, определенное по формуле:

, (3)

где sim(A,C) - значение параметра сходства для третьей и пятой вершин 508, 512, sim(C, B) - значение параметра сходства для пятой и четвертой вершин 512, 510, R - заранее заданный коэффициент, например, равный 10.

[0130] Кроме того, сервер 250 может определять оценку сходства, связанную со поставщиком 247 старых элементов, как максимальное суммарное весовое значение для перехода от вершины, связанной со поставщиком 247 старых элементов, к вершине, связанной с поставщиком из набора 514 эталонных поставщиков старых элементов (утолщенные линии на фиг. 5).

[0131] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии каждый поставщик из набора 514 эталонных поставщиков старых элементов может быть выбран из множества 245 поставщиков старых элементов случайным образом. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии набор 514 эталонных поставщиков старых элементов может быть выбран из множества 245 поставщиков старых элементов в виде заданного количества наиболее популярных среди пользователей рекомендательной онлайн-платформы 260 поставщиков старых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять количество наиболее популярных поставщиков старых элементов из множества 245 поставщиков старых элементов путем анализа истории пользовательских действий пользователей рекомендательной онлайн-платформы 260 со старой частью 255 цифровых элементов. Например, сервер 250 может определять количество наиболее популярных поставщиков старых элементов как поставщиков элементов, старые цифровые элементы которых удовлетворяют по меньшей мере одному из следующих условий: (а) их больше всего ищут на рекомендательной онлайн-платформе 260; (б) их больше всего оценивают на рекомендательной онлайн-платформе 260; (в) они получили наибольшее количество указаний на положительные пользовательские отклики на рекомендательной онлайн-платформе 260 и т.д. В другом примере сервер 250 может (а) определять количество лучших поставщиков старых элементов, предлагая, например, с помощью элемента GUI в интерфейсе 300 GUI рекомендательной онлайн-платформы 260, ее пользователям указать несколько, например, 3, 4 или 10, поставщиков из множества 245 поставщиков старых элементов, наиболее интересных для пользователей; и (б) на основе таких указаний определять количество наиболее популярных поставщиков старых элементов, содержащее набор 514 эталонных поставщиков старых элементов.

[0132] Кроме того, как описано выше, на основе определенной таким образом оценки сходства поставщика 247 старых элементов сервер 250 может определять первое значение вероятности получения старым цифровым элементом из множества 257 старых цифровых элементов указания на положительный пользовательский отклик.

[0133] Как описано выше, сервер 250 также может определять второе значение вероятности получения старым цифровым элементом из множества 257 старых цифровых элементов указания на положительный пользовательский отклик на основе значения параметра популярности, связанного со старым цифровым элементом в некоторой области, такой как город, страна, регион и т.п. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определить второе значение вероятности согласно следующему уравнению:

, (4)

где Popularity - значение популярности старого цифрового элемента в данной области, maxPopularity - значение популярности наиболее популярного в данной области старого цифрового элемента из множества 257 старых цифровых элементов поставщика 247 старых элементов, minPopularity - значение популярности наименее популярного в данной области старого цифрового элемента из множества 257 старых цифровых элементов поставщика 247 старых элементов, c и d - коэффициенты.

[0134] Подобно коэффициентам a и b из уравнения (2), коэффициенты c и d представляют собой параметры из числа параметров этапа использования для алгоритма формирования синтезированных пользовательских откликов. Таким образом, как более подробно описано ниже, сервер 250 может определять эти коэффициенты так, чтобы указания на синтезированные пользовательские отклики, определенные для элементов из старой части 255 цифровых элементов на основе по меньшей мере их вторых значений вероятности, были распределены в старой части 255 цифровых элементов согласно фактическому распределению откликов для прогнозируемых указаний на пользовательские отклики в старой части 255 цифровых элементов, определенных оценивающей моделью ML, как это описано выше.

[0135] В контексте настоящего описания, в отличие от популярности элемента, определяемой на основе указаний на пользовательские отклики, оставленные на рекомендательной онлайн-платформе 260, как это описано выше, параметр популярности представляет собой метрику популярности, связанную со старым цифровым элементом и определяемую на основе указаний на пользовательские действия с этим старым цифровым элементом, выполняемые вне рекомендательной онлайн-платформы 260, с использованием других источников, доступных в данной области, таких как радиостанции, телевизионные каналы, музыкальные клубы, живые концерты и т.п., или других онлайн-источников. В частности, в описанном выше примере, где рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио, а старый цифровой элемент представляет собой аудиопоток, параметр популярности может, среди прочего, включать в себя по меньшей мере одно из следующего: (а) количество потоков аудиопотока на медиа-ресурсе; (б) количество запросов на воспроизведение аудиопотока на медиа-ресурсе; (в) позицию аудиопотока в хит-параде; (г) количество проданных альбомов, содержащих аудиопоток, и т.д.

[0136] Кроме того, как описано выше, на основе первого и/или второго значений вероятности сервер 250 может определять значение вероятности получения старым цифровым элементом указания на положительный пользовательский отклик. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии значение вероятности может быть определено на основе только первого значения вероятности. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значение вероятности на основе только второго значения вероятности. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значение вероятности на основе сочетания, например, суммы первого и второго значений вероятности.

[0137] Кроме того, как описано выше, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов определению его параметров этапа использования, таких как коэффициенты a, b, c и d, для последующего использования при определении указаний на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов.

[0138] С этой целью, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может: (а) инициализировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов, например, случайным образом; (б) итеративно выполнять алгоритм формирования синтезированных пользовательских откликов, выбирая различные элементы из старой части 255 цифровых элементов; (в) после заранее заданного количества итераций выполнения алгоритма формирования синтезированных пользовательских откликов определять обучающее распределение синтезированных откликов для определенных таким образом указаний на синтезированные пользовательские отклики в старой части 255 цифровых элементов; и (г) корректировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы обучающее распределение синтезированных откликов с требуемой точностью соответствовало распределению откликов для прогнозируемых указаний на пользовательские отклики, определенных оценивающей моделью ML.

[0139] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может использовать все элементы из старой части 255 цифровых элементов для обучения алгоритма формирования синтезированных пользовательских откликов. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять обучающий набор старых цифровых элементов, содержащий конкретную часть из старой части 255 цифровых элементов, такую как множества старых цифровых элементов конкретных поставщиков из множества 245 поставщиков старых элементов, которые сервер 250 затем может использовать для обучения алгоритма формирования синтезированных пользовательских откликов. На способ выбора сервером 250 заранее заданного количества итераций выполнения алгоритма формирования синтезированных пользовательских откликов, который может включать в себя выбор этого количества на основе количества цифровых элементов, используемых для обучения алгоритма формирования синтезированных пользовательских откликов, не накладывается ограничений. Например, заранее заданное количество может, среди прочего, соответствовать 100, 1000 или даже десяткам или сотням тысяч итераций.

[0140] Также не накладывается ограничений на способ выбора сервером 250 старого цифрового элемента из множества 257 старых цифровых элементов, который в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии может включать в себя выбор старого цифрового элемента на основе значения его параметра популярности в данной области, определенного, как это описано выше.

[0141] Например, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может выбирать старый цифровой элемент из множества 257 старых цифровых элементов для определения его значения вероятности с использованием, среди прочего, одного из следующих подходов: (а) случайным образом; (б) с использованием равномерных вероятностей выбора, т.е. с равными шансами выбора старого цифрового элемента относительно других элементов из множества 257 старых цифровых элементов независимо от значения параметра популярности; (в) с использованием значения вероятности выбора, пропорционального значению параметра популярности, т.е. с большими шансами выбора старого цифрового элемента с большим значением его параметра популярности; и (г) с использованием значения вероятности выбора, пропорционального квадратному корню из значения параметра популярности, т.е. с большими шансами выбора старого цифрового элемента с большим значением квадратного корня из его значения параметра популярности. Также возможны и другие подходы к выбору.

[0142] Например, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может корректировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы минимизировать различия между параметрами обучающего распределения синтезированных откликов и распределения откликов. В другом примере сервер 250 может корректировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы графические представления обучающего распределения синтезированных откликов и распределения откликов соответствовали друг другу. Следует отметить, что для определения параметров этапа использования для алгоритма формирования синтезированных пользовательских откликов могут использоваться различные подходы, чтобы обеспечить соответствие по меньшей мере одному из этих условий, включая, например, алгоритмы оптимизации, которые могут, среди прочего, включать в себя алгоритмы, используемые для дифференцируемых целевых функций (такие как алгоритм оптимизации на основе градиентного спуска, алгоритм оптимизации на основе метода Ньютона и т.д.) и недифференцируемых целевых функций (такие как алгоритмы непосредственной оптимизации, алгоритмы стохастической оптимизации, алгоритмы оптимизации популяции и т.д.). Также без выхода за границы настоящей технологии возможны варианты осуществления изобретения, где параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов выбираются эмпирически, чтобы обеспечить соответствие по меньшей мере одному из вышеупомянутых условий.

[0143] Таким образом, в не имеющем ограничительного характера примере сервер 250 может определять параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы уравнения (2) и (4) были представлены следующим образом:

(5)

[0144] Обученный таким образом алгоритм формирования синтезированных пользовательских откликов сервер 250 может использоваться для определения указаний на синтезированные пользовательские отклики для каждого элемента из новой части 275 цифровых элементов, как это описано ниже.

Алгоритм формирования синтезированных пользовательских откликов. Этап использования

[0145] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, чтобы использовать обученный алгоритм формирования синтезированных пользовательских откликов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента (не имеющего указания на пользовательский отклик), такого как элемент из множества 277 новых цифровых элементов, связанного с поставщиком 267 новых элементов, сервер 250 может (а) определять для нового цифрового элемента первое и/или второе значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик согласно уравнениям (5); (б) на основе первого и/или второго значений вероятности этапа использования определять значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик; и (в) на основе значения вероятности этапа использования определять указание на отрицательный или положительный синтезированный пользовательский отклик, как это описано выше применительно к обучению алгоритма формирования синтезированных пользовательских откликов.

[0146] Подобно тому, как это описано выше, сервер 250 может определять первое значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик на основе оценки сходства этапа использования для поставщика 267 новых элементов. С этой целью сервер 250 может (а) определять значения параметра сходства для множества 265 поставщиков новых элементов и (б) формировать граф сходства поставщиков элементов этапа использования подобно графу 500 сходства поставщиков элементов, как это описано выше. Тем не менее, поскольку признаки поставщика элементов из множества 265 поставщиков новых элементов также могут быть недоступными, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может получать значения параметра сходства другим способом.

[0147] В частности, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может получать для каждого поставщика из множества 265 поставщиков новых элементов, такого как новый поставщик 267 элементов, значения параметра сходства относительно поставщиков старых элементов. С этой целью в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значения параметра сходства, связанного с поставщиком 267 новых элементов, на основе оценок, предоставленных оценщиками-людьми.

[0148] На фиг. 6 представлено схематическое изображение оценщика-человека 600, определяющего значения сходства между множеством 265 поставщиков новых элементов и поставщиками из множества 245 поставщиков старых элементов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[0149] Очевидно, что оценщик-человек 600 может осуществлять доступ к данным множеств 245, 265 поставщиков старых и новых элементов с помощью электронного устройства, реализованного подобно электронному устройству 210 пользователя 220 и связанному с сервером 250 через сеть 240 связи, как это описано выше. Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии оценщик-человек 600 может включать в себя множество различных оценщиков-людей.

[0150] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может запрашивать, например, путем передачи указания на задачу ранжирования, оценщика-человека 600 относительно непосредственного предоставления степени сходства между поставщиком 267 новых элементов и, например, заранее заданным количеством (таким как 3, 5, 10 или 20) поставщиков старых элементов из множества 245 поставщиков старых элементов. В ответ оценщик-человек 600 на основе своего восприятия цифровых элементов поставщика 267 новых элементов и множества 245 поставщиков старых элементов может определять набор 602 схожих поставщиков старых элементов. Соответственно, поставщик из набора 602 схожих поставщиков старых элементов может содержать сформированную оценщиком метку 604, указывающую на степень сходства, относящуюся к новому поставщику 267 элементов. Как описано выше, сервер 250 может использовать определенные таким образом степени сходства в качестве значений параметров сходства между каждым из множества 265 поставщиков новых элементов и поставщиками старых элементов из множества 245 поставщиков старых элементов.

[0151] Подобно тому, как это описано выше, сервер 250 может формировать граф сходства поставщиков элементов этапа использования на основе (а) множества 265 поставщиков новых элементов, (б) поставщиков старых элементов, имеющих ненулевое значение параметра сходства с поставщиком из множества 265 поставщиков новых элементов, таких как набор 602 схожих поставщиков старых элементов, связанных с поставщиком 267 новых элементов, и (в) значений параметра сходства между поставщиками по пунктам (а) и (б).

[0152] Кроме того, сервер 250 может определять в графе сходства поставщиков элементов этапа использования для множества 265 поставщиков новых элементов набор новых эталонных поставщиков элементов подобно тому, как это описано выше для графа 500 сходства поставщиков элементов. И наконец, как описано выше, сервер 250 может определять оценку сходства поставщика 267 новых элементов как максимальный суммарный вес перехода в графе сходства поставщиков элементов этапа использования между вершинами, представляющими поставщика 267 новых элементов с поставщиком из набора эталонных поставщиков новых элементов. Соответственно, применяя уравнения (5) в отношении определенной таким образом оценки сходства этапа использования, сервер 250 может определять первое значение вероятности этапа использования для получения новым цифровым элементом положительного пользовательского отклика.

[0153] Кроме того, как описано выше применительно к старому цифровому элементу, сервер 250 может (а) определять для нового цифрового элемента значение параметра популярности этапа использования и (б) путем применения уравнений (5) в отношении значения параметра популярности этапа использования определять второе значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик.

[0154] Кроме того, как также описано выше, на основе первого и/или второго значений вероятности этапа использования сервер 250 может определять значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик, на основе которого сервер 250 может определять указание на синтезированный пользовательский отклик для нового цифрового элемента.

[0155] Соответственно, путем итеративного выполнения алгоритма формирования синтезированных пользовательских откликов для заранее заданного количества итераций и выбора на каждой итерации другого нового цифрового элемента из новой части 275 цифровых элементов, как это описано выше применительно к старой части 255 цифровых элементов, сервер 250 может формировать указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов.

[0156] В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов другим способом. В частности, в этих вариантах осуществления изобретения сервер 250 может: (а) определять для поставщика 267 новых элементов эталонного поставщика старых элементов из множества 245 поставщиков старых элементов; (б) определять локальное распределение откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов; и (в) назначать для множества 277 новых цифровых элементов, связанных с поставщиком 267 новых элементов, указания на синтезированные пользовательские отклики согласно локальному распределению откликов.

[0157] На способ определения сервером 250 эталонного поставщика старых элементов для поставщика 267 новых элементов не накладывается ограничений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять эталонного поставщика старых элементов как наиболее схожего с поставщиком 267 новых элементов поставщика из множества 245 поставщиков старых элементов. Например, в этих вариантах осуществления изобретения сервер 250 может определять наиболее схожего с поставщиком 267 новых элементов поставщика из множества 245 поставщиков старых элементов на основе меток оценщиков-людей, как это описано выше со ссылкой на фиг. 6. Например, сервер 250 может определять эталонного поставщика старых элементов для поставщика 267 новых элементов как поставщика с наибольшим рангом из набора 602 схожих поставщиков старых элементов.

[0158] В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять эталонного поставщика старых элементов для поставщика 267 новых элементов как наиболее популярного поставщика из множества 245 поставщиков старых элементов, как это описано выше со ссылкой на фиг. 5.

[0159] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять локальное распределение откликов лишь для фактических указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять локальное распределение откликов для прогнозируемых указаний на пользовательские отклики во множестве старых цифровых элементов, определенных оценивающей моделью ML, как это описано выше.

[0160] На способ определения сервером 250 локального распределения откликов не накладывается ограничений. Он может включать в себя любые подходы, описанные выше применительно к распределению откликов.

[0161] Таким образом, определив локальное распределение указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов, сервер 250 может назначать согласно такому распределению указание на синтезированный пользовательский отклик для каждого элемента из множества 277 новых цифровых элементов.

[0162] Например, можно предположить, что множество старых цифровых элементов эталонного поставщика старых элементов содержит пять старых цифровых элементов с указаниями на положительный или отрицательный пользовательский отклик, распределенными в нем следующим образом: [100/25; 108000/580; 9995874/36954; 135001/398; 127/24]. Таким образом, с использованием этого локального распределения откликов сервер 250 может назначать указания на синтезированные пользовательские отклики для множества 277 новых цифровых элементов так, чтобы минимизировать различия между параметрами, такими как математическое ожидание и среднеквадратическое отклонение, для локального распределения откликов и сформированного таким образом распределения указаний на синтезированный пользовательский отклик во множестве 277 новых цифровых элементов (описано выше). Таким образом, если множество 277 новых цифровых элементов также содержит пять цифровых элементов, то сервер 250 может определять для него указания на синтезированные пользовательские отклики, совпадающие с локальным распределением откликов из описанного выше примера. Можно сказать, что в результате сервер 250 имитирует локальное распределение откликов для указаний на пользовательские отклики во множестве старых цифровых элементов с целью формирования указаний на синтезированные пользовательские отклики для каждого элемента из множества 277 новых цифровых элементов.

[0166] Таким образом, определив указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов, сервер 250 может использовать новую часть 275 цифровых элементов для обучения алгоритма 280 MLA определению набора 225 рекомендуемых цифровых элементов, как это описано выше. В частности, сервер 250 может формировать новый обучающий набор данных, содержащий множество новых обучающих цифровых объектов, каждый из которых содержит по меньшей мере (а) указание на новый цифровой элемент из новой части 275 цифровых элементов и (б) по меньшей мере одно указание на синтезированный пользовательский отклик, определенный как это описано выше. Кроме того, сервер 250 на основе множества новых обучающих цифровых объектов может обучать алгоритм 280 MLA определению значения вероятности положительного действия пользователя 220 с новым цифровым элементом и на основе этого значения вероятности определять набор рекомендуемых цифровых элементов из числа других элементов из старой и новой частей 255, 275 цифровых элементов.

[0164] В не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 280 MLA может основываться на нейронных сетях (NN, Neural Network), на сверточных сетях NN (CNN, Сonvolutional NN), на сетях на основе трансформера, на моделях дерева решений, на алгоритме MLA на основе дерева решений с градиентным бустингом, на алгоритме MLA на основе обучения правилам ассоциации, на алгоритме MLA на основе глубокого обучения, на алгоритме MLA на основе индуктивного логического программирования, на алгоритме MLA на основе метода опорных векторов, на алгоритме MLA на основе кластеризации, на байесовских сетях, на алгоритме MLA на основе обучения с подкреплением, на алгоритме MLA на основе обучения представлению, на алгоритме MLA на основе обучения сходству и метрикам, на алгоритме MLA на основе обучения на скудном словаре, на алгоритме MLA на основе генетических алгоритмов и т.п. Для обучения алгоритма 280 сервер 250 может использовать подход обучения с учителем без выхода за границы настоящей технологии.

[0165] Ниже со ссылкой на фиг. 7 описан пример модели машинного обучения на основе которой может быть реализован алгоритм 280 MLA, а также процесс его обучения согласно по меньшей мере некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.

Архитектура модели машинного обучения

[0166] На фиг. 7 представлена схема модели 700 дерева решений, которая может использоваться с по меньшей мере некоторыми не имеющими ограничительного характера вариантами осуществления настоящей технологии. Модель 700 дерева решений предназначена для иллюстрации модели дерева решений общего назначения, которая может быть модифицирована так, чтобы соответствовать требованиям к конкретной модели прогнозирования, такой как алгоритм 280 MLA. Например, такие модификации могут, в числе прочего, включать в себя добавление или удаление одного или нескольких уровней дерева, добавление или удаление узлов (т.е. признаков и связанных с ними разветвлений), добавление или удаление ветвей, соединяющих узлы и/или листья дерева.

[0167] Модель 700 дерева решений может представлять собой обученную модель дерева. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сформированная модель 700 дерева решений может быть обновлена и/или модифицирована, например, для повышения точности модели машинного обучения и/или для расширения области применения модели машинного обучения. В частности, в некоторых вариантах осуществления изобретения на модели 700 дерева решений может, в числе прочего, основываться определение значений вероятности положительного действия пользователей рекомендательной онлайн-системы 260, таких как пользователь 220, с каждым элементом из множества 235 цифровых элементов, размещенных на рекомендательной онлайн-платформе 260. Также возможны и другие области применения модели 700 дерева решений без выхода за границы настоящей технологии.

[0168] Модель 700 дерева решений содержит первый узел 702, связанный с первым признаком f1. Первый узел 702 образует первый уровень модели 700 дерева решений. Первый узел 702 связан ветвями со вторым узлом 704 и с третьим узлом 706. Второй узел 704 и третий узел 706 связаны со вторым признаком f2. Второй узел 704 и третий узел 706 образуют второй уровень модели 700 дерева решений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии первый признак f1 (и разветвление для первого признака f1) выбран из набора признаков для размещения на первом уровне модели 700 дерева решений на основе множества обучающих цифровых объектов. Например, этот признак может характеризовать цифровой элемент и/или взаимодействовавшего с ним пользователя и/или способ взаимодействия пользователя с элементом (более подробно описано ниже).

[0169] Первый признак f1 выбирается так, что для цифрового объекта значение параметра, связанного с первым признаком f1, определяет то, со вторым узлом 704 или с третьим узлом 706 должен быть связан этот цифровой объект. Например, если значение меньше значения f1, цифровой объект связан со вторым узлом 704. В другом примере, если значение большее значения f1, цифровой объект связан с третьим узлом 706.

[0170] В свою очередь, второй узел 704 связан с четвертым узлом 708, связанным с третьим признаком f3, и с пятым узлом 710, связанным с третьим признаком f3. Третий узел 706 связан с шестым узлом 712, связанным с третьим признаком f3, и с седьмым узлом 714, связанным с третьим признаком f3. Четвертый узел 708, пятый узел 710, шестой узел 712 и седьмой узел 714 образуют третий уровень модели 700 дерева решений. Как описано выше применительно к первому узлу 702, для цифрового объекта значение параметра, связанного со вторым признаком f2, определяет то, с четвертым узлом 708 или с пятым узлом 710 (если цифровой объект связан со вторым узлом 704) либо с шестым узлом 712 или с седьмым узлом 714 (если цифровой объект связан с третьим узлом 706) должен быть связан этот цифровой объект.

[0171] В свою очередь, все узлы из числа четвертого узла 708, пятого узла 710, шестого узла 712 и седьмого узла 714 связаны с наборами прогнозируемых параметров. В представленном на фиг. 7 примере наборы прогнозируемых параметров содержат первый набор 720, второй набор 722, третий набор 724 и четвертый набор 726. Каждый набор из числа наборов прогнозируемых параметров содержит три целевых значения C1, C2 и C3, например, предоставленных оценщиками-людьми (как это описано ниже).

[0172] Как должно быть понятно специалисту в области настоящей технологии, модель 700 дерева решений иллюстрирует вариант осуществления изобретения, в котором конкретный уровень модели 700 дерева решений связан с одним признаком. В представленном на фиг. 7 примере первый уровень содержит первый узел 702 и связан с первым признаком f1, второй уровень содержит второй узел 704 и третий узел 706 и связан со вторым признаком f2, третий уровень содержит четвертый узел 708, пятый узел 710, шестой узел 712 и седьмой узел 714 и связан с третьим признаком f3.

[0173] Иными словами, в представленном на фиг. 7 варианте осуществления изобретения первый уровень связан с первым признаком f1, второй уровень связан со вторым признаком f2, третий уровень связан с третьим признаком f3. Тем не менее, возможны и другие варианты осуществления изобретения. В частности, возможен альтернативный вариант осуществления изобретения, в котором сформированная модель дерева может содержать различные признаки для некоторого уровня модели дерева. Например, первый уровень такой модели дерева может содержать первый узел, связанный с первым признаком f1, второй уровень может содержать второй узел, связанный со вторым признаком f2, и третий узел, связанный с третьим признаком f3. Как должно быть понятно специалисту в области настоящей технологии, возможны и другие варианты сопоставления признаков с уровнем без выхода за границы настоящей технологии.

[0174] На выбор признаков, таких как первый признак f1, второй признак f2 и третий признак f3, для формирования модели 700 дерева решений не накладывается ограничений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии выбор признаков и, следовательно, разветвлений между узлами модели 700 дерева решений, может включать в себя оптимизацию метрики, указывающей на качество признака для разделения по ветвям модели 700 дерева решений множества обучающих цифровых объектов в процессе обучения, по мере подачи каждого объекта из множества обучающих цифровых объектов в модель 700 дерева решений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии такая метрика может включать в себя метрику оценки корректности положительных результатов (Estimate of Positive Correctness), метрику «примеси Джини» (Gini Impurity), метрику прироста информации (Information Gain) и т.п. В конкретных не имеющих ограничительного характера вариантах осуществления настоящей технологии признаки могут выбираться на основе максимизации параметра качества прогнозирования протодеревьев, из которых состоит модель 700 дерева решений, например, как описано в патентной заявке US2019164084A1 «Method of and system for generating prediction quality parameter for a prediction model executed in a machine learning algorithm» (опубликована 30 мая 2019 г.), содержание которой полностью включено в настоящий документ посредством ссылки.

[0175] Кроме того, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, алгоритм 280 MLA может содержать один экземпляр модели 700 дерева решений. В этом случае алгоритм MLA может называться одиночным деревом решений. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 280 MLA может содержать ансамбль деревьев решений, реализованных подобно модели 700 дерева решений. Тогда алгоритм 280 MLA может называться лесом деревьев решений. В этом случае окончательный прогноз ансамбля деревьев решений основывается на результатах прогнозирования каждого дерева решений ансамбля. На построение ансамбля деревьев решений не накладывается ограничений, например, оно может включать в себя использование подхода на основе бустинга, такого как подход на основе градиентного бустинга.

[0176] В общем случае бустинг представляет собой способ построения ансамбля деревьев решений, где деревья строятся поэтапно (в отличие от формирования случайного леса, где деревья могут формироваться параллельно) так, что различие между целевыми значениями и прогнозируемыми выходными данными ансамбля деревьев решений минимизируется на каждой итерации при формировании каждого нового дерева решений. Например, различие между целевыми значениями и результатами прогнозирования ансамбля деревьев решений может выражаться функцией потерь, такой как функция потерь кросс-энтропии.

[0177] Должно быть понятно, что в не имеющих ограничительного характера вариантах осуществления настоящей технологии возможны и другие варианты реализации функции потерь, например, функция потерь среднеквадратичной ошибки, функция потерь по Губеру, кусочно-линейная функция потерь и т.д.

[0178] Иными словами, применяя подход на основе бустинга, алгоритм 280 MLA использует деревья решений в качестве слабых учеников, которых алгоритм 280 MLA последовательно объединяет таким образом, чтобы каждый новый ученик соответствовал невязкам предыдущей итерации, улучшая совокупный результат всего ансамбля деревьев решений. Иными словами, каждое дерево решений строится на одном и том же множестве обучающих цифровых объектов, при этом обучающие цифровые объекты, для которых первое дерево решений допустило «ошибки» при прогнозировании, имеют приоритет при построении второго дерева решений и т.д. Затем алгоритм 280 MLA объединяет результаты каждой итерации, формируя сильного ученика.

[0179] В конкретных не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 280 MLA может содержать ансамбль деревьев решений CatBoost как, например, это описано в работе «CatBoost: gradient boosting with categorical features support» (Dorogush et al., опубликована компанией Yandex Inc.), содержание которой полностью включено в настоящий документ посредством ссылки.

[0180] В общем случае можно сказать, что процессор сервера 250 должен выполнять два процесса, относящихся к алгоритму 280 MLA. Первый процесс из числа этих двух процессов представляет собой процесс обучения, где процессор 110, например, сервера 250, способен обучать алгоритм 280 MLA на основе множества обучающих цифровых объектов (также называемого обучающим набором данных) определению значений вероятности положительного действия пользователя 220 с каждым элементом из множества 235 цифровых элементов.

[0181] Второй процесс представляет собой процесс этапа использования, где процессор сервера 250 выполняет обученный таким образом алгоритм 280 MLA для определения значений вероятности положительного действия пользователя 220 с каждым элементом из множества 235 цифровых элементов согласно не имеющим ограничительного характера вариантам осуществления настоящей технологии. Тем не менее в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм MLA может быть обучен на стороннем сервере, а сервер 250 может выполнять алгоритм 280 MLA.

[0182] Должно быть понятно, что в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 280 MLA может содержать несколько моделей машинного обучения, способных определять значения вероятности положительного действия пользователя 220 со множеством 235 цифровых элементов. В частности, наряду с описанной выше моделью 700 дерева решений, алгоритм 280 MLA может содержать дополнительные модели машинного обучения. В различных не имеющих ограничительного характера вариантах осуществления настоящей технологии дополнительная модель машинного обучения может, например, содержать углубленную структурированную семантическую модель машинного обучения. В различных не имеющих ограничительного характера вариантах осуществления настоящей технологии углубленная структурированная семантическая модель машинного обучения может быть обучена сервером 250 на основе того же или иного множества обучающих цифровых объектов, используемого для обучения модели 700 дерева решений.

[0183] Обучив алгоритм 280 MLA на основе нового обучающего набора данных, сервер 250 может представить по меньшей мере некоторые элементы из новой части 275 цифровых элементов пользователю 220 в качестве части набора 225 рекомендуемых цифровых элементов.

[0184] После представления пользователю 220 нового цифрового элемента из новой части 275 цифровых элементов путем назначения для него указания на синтезированный пользовательский отклик, как это описано выше, сервер 250 может получить указание на пользовательский отклик от пользователя 220. Если указание на пользовательский отклик от пользователя 220 отличается от указания на синтезированный пользовательский отклик, то сервер 250 может заменить последнее на первое. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может добавлять указание на пользовательский отклик от пользователя 220 к сформированному таким образом указанию на синтезированный пользовательский отклик.

Первый способ

[0185] Описанные выше архитектура и примеры позволяют выполнять способ формирования обучающего набора данных для обучения алгоритма MLA, такого как алгоритм 280 MLA, формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы 260. На фиг. 8 представлена блок-схема первого способа 800 согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. Способ 800 может выполняться сервером 250.

[0186] Как описано выше, сервер 250 может формировать обучающий набор данных для обучения алгоритма MLA путем формирования указаний на синтезированный пользовательский отклик для новых цифровых элементов, не имеющих указаний на фактические пользовательские отклики от пользователей рекомендательной онлайн-платформы 260.

Шаг 802: получение сервером указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом.

[0187] Первый способ 800 начинается с шага 802, на котором сервер 250 способен обучать оценивающую модель ML определению указаний на синтезированный пользовательский отклик для цифровых элементов, таких как новая часть 275 цифровых элементов. Как описано выше, с этой целью сервер 250 может: (а) обучать оценивающую модель ML определению прогнозируемых указаний на пользовательские отклики для элементов из старой части 255 цифровых элементов, не имеющих указаний на пользовательские отклики; (б) определять распределение откликов для прогнозируемых указаний на пользовательские отклики в старой части цифровых элементов; и (в) на основе распределения откликов определять параметры этапа использования для алгоритма формирования синтезированных откликов, включая коэффициенты уравнений (2) и (4), для последующего использования при определении указаний на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов.

[0188] Как описано выше со ссылкой на фиг. 4A и 4Б, сервер 250 может обучать оценивающую модель ML определению прогнозируемых указаний на пользовательские отклики, таких как прогнозируемое указание 408 для пользователя 220, для другого элемента из старой части 255 цифровых элементов на основе фактических указаний на пользовательские отклики, таких как фактическое указание 406, предоставленное пользователем 220 для элемента из старой части 255 цифровых элементов.

[0189] Как описано выше, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии оценивающая модель ML содержит модель ML матричной факторизации, для обучения которой, как это описано со ссылкой на фиг. 4A, сервер 250 может формировать входную матрицу 402, содержащую множество обучающих цифровых объектов для оценивания. В частности, входная матрица 402 имеет размер m*n, где m - количество пользователей рекомендательной онлайн-платформы 260, n - количество старых цифровых элементов в старой части 255 цифровых элементов. Таким образом, элемент входной матрицы 402, представляющий обучающий цифровой объект для оценивания из множества обучающих цифровых объектов для оценивания, содержит: (а) фактическое указание 406 на пользовательский отклик, предоставленный пользователем 220 для старого цифрового элемента из старой части 255 цифровых элементов; (б) признаки элемента для старого цифрового элемента; и (в) пользовательские признаки пользователя 220, сформировавшего фактическое указание 406 под старым цифровым элементом.

[0190] Далее первый способ 800 продолжается на шаге 804.

Шаг 804: ввод сервером множества цифровых объектов для оценивания в оценивающую модель ML и обучение таким образом оценивающей модели ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных.

[0191] На шаге 804 сервер 250 на основе множества обучающих цифровых объектов для оценивания, представленных с помощью входной матрицы 402, может обучать оценивающую модель ML определению указания на синтезированный пользовательский отклик для нового цифрового элемента с использованием распределения откликов в качестве фактических данных.

[0192] С этой целью, как подробно описано со ссылкой на фиг. 4A и 4Б, сервер 250 сначала может обучать оценивающую модель ML определению прогнозируемых указаний на пользовательские отклики путем определения на основе входной матрицы 402 матриц P и Q векторных представлений пользователей и элементов так, что элементы выходной матрицы 404, определяемой как PQ ^T, обеспечивают близкую аппроксимацию элементов входной матрицы 402. Определенная таким образом выходная матрица 404: (а) для элемента из старой части 255 цифровых элементов, который ранее не имел указания на пользовательский отклик, содержит прогнозируемое указание 408 на пользовательский отклик; и (б) для элементов из старой части 255 цифровых элементов, имевших фактические указания на пользовательские отклики, таких как старый цифровой элемент, связанный с фактическим указанием 406 на пользовательский отклик, аппроксимирует такие указания с требуемой точностью.

[0193] Кроме того, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять распределение откликов для прогнозируемых указаний на пользовательские отклики, определенных оценивающей моделью ML, в старой части 255 цифровых элементов. Например, как описано выше, сервер 250 может определять (а) параметры распределения откликов, в числе прочего, такие как математическое ожидание, среднеквадратическое отклонение, коэффициент асимметрии и крутизна распределения откликов, и/или (б) графическое представление распределения.

[0194] Кроме того, с использованием распределения откликов сервер 250 может определять параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов с целью его применения в отношении новой части 275 цифровых элементов. В частности, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов, такие как коэффициенты уравнений (2) и (4), так, чтобы указания на синтезированные пользовательские отклики, определенные таким образом, были распределены в новой части 275 цифровых элементов в соответствии с распределением откликов.

[0195] С этой целью, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов на основе старой части 255 цифровых элементов. В частности, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов так, чтобы с учетом конкретного подхода к выбору старых цифровых элементов из старой части 255 цифровых элементов алгоритм формирования синтезированных пользовательских откликов был способен: (а) определять для старого цифрового элемента, такого как элемент из множества 257 старых цифровых элементов, связанного со поставщиком 247 старых элементов, значение вероятности получения старым цифровым элементом, например, положительного пользовательского отклика; и (б) назначать на основе этого значения вероятности указание на синтезированный пользовательский отклик для старого цифрового элемента так, чтобы указания на синтезированные пользовательские отклики были распределены во множестве 257 старых цифровых элементов согласно распределению откликов, как это описано выше.

[0196] Например, сервер 250 может назначать указание на синтезированный пользовательский отклик для старого цифрового элемента на основе значения вероятности, связанного с ним, и заранее заданных верхнего и нижнего порогов вероятности, как это описано выше.

[0197] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, поскольку признаки элемента для новой части 275 цифровых элементов могут быть недоступными, сервер 250 может определять другие признаки для старой части 255 цифровых элементов с целью обучения алгоритма формирования синтезированных пользовательских откликов, как это также описано выше. В частности, для старого цифрового элемента из старой части 255 цифровых элементов сервер 250 может определять: (а) оценку сходства поставщика 247 старых элементов этого старого цифрового элемента относительно других поставщиков из множества 245 старых поставщиков старых элементов и (б) значение параметра популярности.

[0198] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять оценку сходства, связанную со поставщиком 247 старых элементов, на графе 500 сходства поставщиков элементов, как подробно описано со ссылкой на фиг. 5. Как описано выше, сервер 250 может определять значение параметра популярности, связанного со старым цифровым элементом, на основе данных из источников вне рекомендательной онлайн-платформы 260.

[0199] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значение вероятности получения старым цифровым элементом указания на положительный пользовательский отклик на основе (а) первого значения вероятности, определенного на основе оценки сходства, связанной со поставщиком 247 старых элементов, согласно уравнению (2), и/или (б) второго значения вероятности, определенного на основе значения параметра популярности, связанного со старым цифровым элементом, согласно уравнению (4).

[0200] Кроме того, сервер 250 может определять коэффициенты a, b, c и d уравнений (2) и (4), которые представляют собой параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов, с использованием распределения откликов для прогнозируемых указаний на пользовательские отклики в старой части 255 цифровых элементов в качестве фактических данных. Как подробно описано выше, с этой целью, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может: (а) инициализировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов, например, случайным образом; (б) итеративно выполнять алгоритм формирования синтезированных пользовательских откликов, выбирая различные элементы из старой части 255 цифровых элементов; (в) после заранее заданного количества итераций выполнения алгоритма формирования синтезированных пользовательских откликов определять обучающее распределение синтезированных откликов для определенных таким образом указаний на синтезированные пользовательские отклики в старой части 255 цифровых элементов; и (г) корректировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы обучающее распределение синтезированных откликов с требуемой точностью соответствовало распределению откликов для прогнозируемых указаний на пользовательские отклики, определенных оценивающей моделью ML.

[0201] Таким образом, сервер 250 может определять параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы уравнения (2) и (4) были представлены уравнениями (5), которые в этом случае могут использоваться для определения указаний на синтезированные пользовательские отклики для каждого элемента из новой части 275 цифровых элементов.

[0202] Далее первый способ 800 продолжается на шаге 806.

Шаг 806: получение сервером указания на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов, и применение сервером оценивающей модели ML в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов для определения указания на синтезированный пользовательский отклик для нового цифрового элемента.

[0203] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, на шаге 806 сервер 250 может получать от множества 265 поставщиков новых элементов новую часть 275 цифровых элементов и применять в их отношении алгоритм формирования синтезированных пользовательских откликов с параметрами, определенными на шаге 804.

[0204] С этой целью сервер 250 может: (а) определять для нового цифрового элемента первое и/или второе значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик согласно уравнениям (5); (б) на основе первого и/или второго значений вероятности этапа использования определять значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик; и (в) на основе значения вероятности этапа использования определять указание на отрицательный или положительный синтезированный пользовательский отклик, как это описано выше применительно к обучению алгоритма формирования синтезированных пользовательских откликов.

[0205] Подобно тому, как описано выше, сервер 250 может определять первое значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик на основе оценки сходства этапа использования для поставщика 267 новых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять оценку сходства этапа использования, связанную с поставщиком 267 новых элементов, на основе графа сходства поставщиков элементов этапа использования, сформированного подобно графу 500 сходства поставщиков элементов, но на основе значений параметров сходства множеств 245, 265 поставщиков старых и новых элементов, полученных от оценщиков-людей, как это подробно описано со ссылкой на фиг. 6. Определив оценку сходства этапа использования, сервер 250 с использованием уравнений (5) может определять первое значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик.

[0206] Кроме того, сервер 250 может (а) определять для нового цифрового элемента значение параметра популярности этапа использования и (б) путем применения уравнений (5) в отношении значения параметра популярности этапа использования определять второе значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик.

[0207] Кроме того, как это также описано выше, на основе первого и/или второго значений вероятности этапа использования сервер 250 может определять значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик, на основе которого сервер 250 может определять указание на синтезированный пользовательский отклик для нового цифрового элемента.

[0208] Соответственно, путем итеративного выполнения алгоритма формирования синтезированных пользовательских откликов для заранее заданного количества итераций и выбора на каждой итерации другого нового цифрового элемента из новой части 275 цифровых элементов, как это описано выше применительно к старой части 255 цифровых элементов, сервер 250 может формировать указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов.

[0209] Далее первый способ 800 переходит к шагу 808.

Шаг 808: формирование сервером обучающего набора данных, содержащего множество обучающих цифровых объектов, каждый из которых содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик.

[0210] Определив указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов, на шаге 808 сервер 250 может использовать новую часть 275 цифровых элементов с определенными таким образом указаниями на синтезированные пользовательские отклики с целью формирования нового обучающего набора данных, содержащего множество новых обучающих цифровых объектов, каждый из которых содержит по меньшей мере (а) указание на новый цифровой элемент из новой части 275 цифровых элементов и (б) по меньшей мере одно указание на синтезированный пользовательский отклик, определенное как это описано выше.

[0211] Далее первый способ 800 продолжается на шаге 810.

Шаг 810: ввод сервером множества обучающих цифровых объектов в алгоритм MLA для обучения алгоритма MLA формированию рекомендаций цифровых элементов.

[0212] На шаге 810 сервер 250 может на основе множества новых цифровых элементов обучать алгоритм 280 MLA определению набора 225 рекомендуемых цифровых элементов, как это описано выше. В частности, сервер 250 может на основе множества новых обучающих цифровых объектов обучать алгоритм 280 MLA определению значения вероятности положительного действия пользователя 220 с новым цифровым элементом и на основе этого значения вероятности определять из числа других элементов из старой и новой частей 255, 275 цифровых элементов набор рекомендуемых цифровых элементов, пример которого подробно описан выше со ссылкой на фиг. 7.

[0213] На этом выполнение первого способа 800 завершается.

Второй способ

[0214] Описанные выше архитектура и примеры позволяют выполнять другой способ формирования обучающего набора данных для обучения алгоритма 280 MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы 260. На фиг. 9 представлена блок-схема второго способа 900 согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. Способ 900 также может выполняться сервером 250.

[0215] Подобно описанному выше первому способу 800, второй способ 900 предназначен для формирования обучающего набора данных для обучения алгоритма MLA путем формирования указаний на синтезированные пользовательские отклики для новой части 275 цифровых элементов, не имеющих указаний на фактические пользовательские отклики от пользователей рекомендательной онлайн-платформы 260.

Шаг 902: получение сервером указания на поставщика новых элементов, имеющего множество новых цифровых элементов, подлежащих загрузке на рекомендательную онлайн-платформу и не имеющих полученных ранее пользовательских откликов.

[0216] Второй способ 900 начинается с шага 902, на котором сервер 250 может получать указание на поставщика 267 новых элементов, загрузившего множество 277 новых цифровых элементов на рекомендательную онлайн-платформу 260, как это описано выше.

[0217] Далее второй способ 900 продолжается на шаге 904.

Шаг 904: получение сервером указания на множество поставщиков старых элементов, загрузивших множество старых цифровых элементов, по меньшей мере некоторые из которых получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы.

[0218] На шаге 904 сервер 250 может получать указание на множество 245 поставщиков старых элементов рекомендательной онлайн-платформы 260, где по меньшей мере некоторые старые цифровые элементы имеют по меньшей мере одно фактическое указание на пользовательский отклик.

[0219] Далее второй способ 900 продолжается на шаге 906.

Шаг 906: анализ сервером поставщика новых элементов и множества поставщиков старых элементов с целью определения эталонного поставщика старых элементов на основе параметра сходства поставщика новых элементов с каждым из множества поставщиков старых элементов.

[0220] На шаге 906 сервер 250 может определять среди множества 245 поставщиков старых элементов эталонного поставщика старых элементов для поставщика 267 новых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять эталонного поставщика старых элементов как поставщика из множества 245 поставщиков старых элементов, наиболее схожего с поставщиком 267 новых элементов. Например, в этих вариантах осуществления изобретения сервер 250 может определять поставщика из множества 245 поставщиков старых элементов, наиболее схожего с поставщиком 267 новых элементов, на основе меток оценщиков-людей, как это описано выше со ссылкой на фиг. 6.

[0221] При этом в других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять эталонного поставщика старых элементов для поставщика 267 новых элементов как наиболее популярного поставщика из множества 245 поставщиков старых элементов, как это описано выше со ссылкой на фиг. 5.

[0222] Далее второй способ 900 продолжается на шаге 908.

Шаг 908: определение сервером распределения откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов.

[0223] На шаге 908 сервер 250 может определять локальное распределение откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять локальное распределение откликов лишь для фактических указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять локальное распределение откликов для прогнозируемых указаний на пользовательские отклики во множестве старых цифровых элементов, определенных оценивающей моделью ML, как это описано выше.

[0224] На способ определения сервером 250 локального распределения откликов не накладывается ограничений. Он может включать в себя любые подходы, описанные выше применительно к распределению откликов.

[0225] Далее второй способ переходит к шагу 910.

Шаг 910: назначение сервером указаний на синтезированные пользовательские отклики множеству новых цифровых элементов поставщика новых элементов согласно распределению откликов для указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов.

[0226] На шаге 910 сервер 250 может назначать указания на синтезированные пользовательские отклики множеству 277 новых цифровых элементов поставщика 267 новых элементов согласно локальному распределению откликов для указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов.

[0227] Например, можно предположить, что множество старых цифровых элементов эталонного поставщика старых элементов содержит пять старых цифровых элементов с указаниями на положительный или отрицательный пользовательский отклик, распределенными в нем следующим образом: [100/25; 108000/580; 9995874/36954; 135001/398; 127/24]. Таким образом, с использованием этого локального распределения откликов сервер 250 может назначать указания на синтезированные пользовательские отклики для множества 277 новых цифровых элементов так, чтобы минимизировать различия между параметрами, такими как математическое ожидание и среднеквадратическое отклонение, для локального распределения откликов и для сформированного таким образом распределения указаний на синтезированный пользовательский отклик во множестве 277 новых цифровых элементов (описано выше). Таким образом, если множество 277 новых цифровых элементов также содержит пять цифровых элементов, то сервер 250 может определять для него указания на синтезированные пользовательские отклики, совпадающие с локальным распределением откликов из описанного выше примера. Можно сказать, что в результате сервер 250 имитирует локальное распределение откликов для указаний на пользовательские отклики во множестве старых цифровых элементов с целью формирования указаний на синтезированные пользовательские отклики для каждого элемента из множества 277 новых цифровых элементов.

[0228] Далее второй способ 900 продолжается на шагах 912 и 914, реализованных подобно шагам 808 и 810, соответственно, первого способа 800.

[0229] На этом выполнение второго способа 900 завершается.

[0230] Обучив алгоритм 280 MLA на основе нового обучающего набора данных, сформированного согласно первому или второму способам 800, 900, сервер 250 может представлять пользователю 220 по меньшей мере некоторые элементы из новой части 275 цифровых элементов в качестве части набора 225 рекомендуемых цифровых элементов.

[0231] После представления пользователю 220 нового цифрового элемента из новой части 275 цифровых элементов путем назначения для него указания на синтезированный пользовательский отклик, как это описано выше, сервер 250 может получить указание на пользовательский отклик от пользователя 220. Если указание на пользовательский отклик от пользователя 220 отличается от указания на синтезированный пользовательский отклик, сервер 250 может заменить последнее на первое. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может добавлять указание на пользовательский отклик от пользователя 220 к сформированному таким образом указанию на синтезированный пользовательский отклик.

[0232] Таким образом, некоторые не имеющие ограничительного характера варианты осуществления настоящей технологии позволяют представлять новые цифровые элементы пользователям рекомендательной онлайн-платформы 260 при наличии ограниченных данных об этих новых цифровых элементах, что может способствовать повышению удовлетворенности пользователей и множества поставщиков новых элементов.

[0233] Для специалиста в данной области могут быть очевидными возможные изменения и усовершенствования описанных выше вариантов осуществления настоящей технологии. Предшествующее описание приведено лишь в иллюстративных целях, а не для ограничения объема изобретения. Объем охраны настоящей технологии определяется исключительно объемом приложенной формулы изобретения.

[0234] Несмотря на то, что описанные выше варианты реализации приведены со ссылкой на конкретные шаги, выполняемые в определенном порядке, должно быть понятно, что эти шаги могут быть объединены, разделены или что их порядок может быть изменен без выхода за границы настоящей технологии. Соответственно, порядок и группировка шагов не носят ограничительного характера для настоящей технологии.

Claims

1. Способ формирования обучающего набора данных для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, имеющей множество цифровых элементов, содержащее:

(1) старую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу одним из множества поставщиков старых элементов, при этом по меньшей мере некоторые старые цифровые элементы из старой части цифровых элементов получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы, а указания на пользовательские отклики по меньшей мере некоторых старых цифровых элементов распределены в старой части цифровых элементов согласно распределению откликов; и

(2) новую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу поставщиком новых элементов из множества поставщиков новых элементов и не имеет пользовательского отклика,

при этом формирование предполагает формирование синтезированных пользовательских откликов для новых цифровых элементов, а способ выполняется сервером, на котором размещена рекомендательная онлайн-платформа, и включает в себя:

- на первом этапе - обучение сервером оценивающей модели машинного обучения определению прогнозируемого указания на пользовательский отклик для цифрового элемента, включающее в себя:

- получение сервером указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом; и

- ввод сервером множества цифровых объектов для оценивания в оценивающую модель машинного обучения и обучение таким образом оценивающей модели машинного обучения определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных;

- на втором этапе, следующем за первым этапом:

- получение сервером указания на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов;

- применение сервером оценивающей модели машинного обучения в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента;

- формирование сервером обучающего набора данных, содержащего множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и

- ввод сервером множества обучающих цифровых объектов в алгоритм машинного обучения для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов.

2. Способ по п. 1, отличающийся тем, что применение оценивающей модели машинного обучения включает в себя определение первого значения вероятности получения указания на положительный пользовательский отклик новым цифровым элементом поставщика новых цифровых элементов, при этом определение основано на оценке сходства поставщика новых элементов со множеством поставщиков старых элементов.

3. Способ по п. 2, отличающийся тем, что первое значение вероятности определяется по формуле:

,

4. Способ по п. 2, отличающийся тем, что он дополнительно включает в себя определение сервером оценки сходства поставщика новых элементов со множеством поставщиков старых элементов.

5. Способ по п. 4, отличающийся тем, что определение оценки сходства поставщика новых элементов включает в себя:

- получение для поставщика старых элементов из множества поставщиков старых элементов значения параметра сходства поставщика старых элементов с поставщиком новых элементов;

- формирование сервером на основе значений параметра сходства каждого поставщика из множества поставщиков старых элементов с поставщиком новых элементов ориентированной графовой структуры, в которой вершина ориентированной графовой структуры представляет поставщика элементов из множества поставщиков старых элементов или из множества поставщиков новых элементов, а ребро, соединяющее пару вершин, представляет ненулевое значение параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов;

- определение сервером для ребра весового значения, указывающего на значение параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов; и

- определение сервером оценки сходства поставщика новых элементов как максимального суммарного весового значения при переходе от вершины ориентированной графовой структуры, связанной с поставщиком новых элементов, к ее начальной вершине.

6. Способ по п. 5, отличающийся тем, что определение весового значения включает в себя определение обратного значения для значения параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов.

7. Способ по п. 5, отличающийся тем, что параметр сходства представляет собой степень сходства поставщика новых элементов с каждым из множества поставщиков старых элементов.

8. Способ по п. 7, отличающийся тем, что он дополнительно включает в себя получение от оценщика-человека степени сходства поставщика новых элементов с каждым из множества поставщиков старых элементов.

9. Способ по п. 2, отличающийся тем, что применение оценивающей модели машинного обучения дополнительно включает в себя определение второго значения вероятности получения указания на положительный пользовательский отклик новым цифровым элементом поставщика новых цифровых элементов, при этом определение основано на значении популярности нового цифрового элемента в данной области.

10. Способ по п. 9, отличающийся тем, что второе значение вероятности определяется по формуле:

,

11. Способ по п. 9, отличающийся тем, что новый цифровой элемент представляет собой аудиопоток, а значение популярности нового цифрового элемента указывает на по меньшей мере одно из следующего: (а) количество потоков аудиопотока на медиа-ресурсе; (б) количество запросов на воспроизведение аудиопотока на медиа-ресурсе; (в) позиция аудиопотока в хит-параде; (г) количество проданных альбомов, содержащих аудиопоток.

12. Способ по п. 9, отличающийся тем, что он дополнительно включает в себя:

- назначение сервером новому цифровому элементу указания на положительный синтезированный пользовательский отклик, если первое и/или второе значение вероятности больше верхнего порога вероятности; и

- назначение сервером новому цифровому элементу указания на отрицательный синтезированный пользовательский отклик, если первое и/или второе значение вероятности меньше нижнего порога вероятности, который меньше верхнего порога вероятности.

13. Способ по п. 12, отличающийся тем, что перед применением оценивающей модели машинного обучения он дополнительно включает в себя выбор сервером нового цифрового элемента из множества новых цифровых элементов.

14. Способ по п. 13, отличающийся тем, что выбор включает в себя выбор нового цифрового элемента из множества новых цифровых элементов одним из следующих способов: (а) случайным образом; (б) с использованием равномерных вероятностей выбора; (в) с использованием значения вероятности выбора, пропорционального значению популярности нового цифрового элемента в данной области; и (г) с использованием значения вероятности выбора, пропорционального квадратному корню из значения популярности нового цифрового элемента в данной области.

15. Способ по п. 13, отличающийся тем, что выбор и применение выполняются итеративно в течение заранее заданного количества итераций перед формированием обучающего набора данных.

16. Способ по п. 1, отличающийся тем, что он дополнительно включает в себя обновление сервером обучающего цифрового объекта из множества обучающих цифровых объектов путем замены в нем указания на синтезированный пользовательский отклик указанием на пользовательский отклик, если сервер определил, что новый цифровой элемент из множества новых цифровых элементов получил пользовательский отклик.

17. Способ по п. 1, отличающийся тем, что оценивающая модель машинного обучения представляет собой модель машинного обучения матричной факторизации.

18. Способ по п. 1, отличающийся тем, что алгоритм машинного обучения представляет собой алгоритм машинного обучения на основе деревьев решений, алгоритм машинного обучения на основе трансформера или алгоритм машинного обучения на основе глубокого семантического сходства.

19. Способ формирования обучающего набора данных для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, имеющей множество цифровых элементов, при этом формирование предполагает формирование синтезированных пользовательских откликов для новых цифровых элементов, а способ выполняется сервером, на котором размещена рекомендательная онлайн-платформа, и включает в себя:

- получение сервером указания на поставщика новых элементов из числа поставщиков новых элементов, имеющего множество новых цифровых элементов, подлежащих загрузке на рекомендательную онлайн-платформу, при этом новый цифровой элемент из множества новых цифровых элементов не имеет полученного ранее пользовательского отклика;

- получение сервером указания на множество поставщиков старых элементов, загрузивших множество старых цифровых элементов, по меньшей мере некоторые из которых получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы;

- анализ сервером поставщика новых элементов и множества поставщиков старых элементов с целью определения эталонного поставщика старых элементов на основе параметра сходства поставщика новых элементов с каждым из множества поставщиков старых элементов;

- определение сервером синтезированных пользовательских откликов для множества новых цифровых элементов поставщика новых элементов на основе пользовательских откликов, полученных множеством старых цифровых элементов эталонного поставщика старых элементов, включающее в себя:

- определение сервером распределения откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов;

- назначение сервером указаний на синтезированные пользовательские отклики множеству новых цифровых элементов поставщика новых элементов согласно распределению откликов для указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов;

20. Сервер для формирования обучающего набора данных для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, размещенной на сервере и имеющей множество цифровых элементов, содержащее:

при этом формирование предполагает формирование синтезированных пользовательских откликов для новых цифровых элементов, а сервер содержит машиночитаемую физическую память, хранящую команды, и процессор, способный при исполнении команд выполнять следующие действия:

- на первом этапе - обучение оценивающей модели машинного обучения определению прогнозируемого указания на пользовательский отклик для цифрового элемента путем:

- получения указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом; и

- ввода множества цифровых объектов для оценивания в оценивающую модель машинного обучения и обучения таким образом оценивающей модели машинного обучения определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных;

- получение указания на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов;

- применение оценивающей модели машинного обучения в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента;

- формирование обучающего набора данных, содержащего множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и

- ввод множества обучающих цифровых объектов в алгоритм машинного обучения для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов.