[go: up one dir, main page]

RU2844072C2 - System and method for forming training data set for training machine learning algorithm - Google Patents

System and method for forming training data set for training machine learning algorithm

Info

Publication number
RU2844072C2
RU2844072C2 RU2022133953A RU2022133953A RU2844072C2 RU 2844072 C2 RU2844072 C2 RU 2844072C2 RU 2022133953 A RU2022133953 A RU 2022133953A RU 2022133953 A RU2022133953 A RU 2022133953A RU 2844072 C2 RU2844072 C2 RU 2844072C2
Authority
RU
Russia
Prior art keywords
digital
new
elements
old
server
Prior art date
Application number
RU2022133953A
Other languages
Russian (ru)
Other versions
RU2022133953A (en
Inventor
Даниил Сергеевич Бурлаков
Вадим Сергеевич Шилов
Original Assignee
Общество с ограниченной ответственностью "Яндекс Музыка"
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Яндекс Музыка" filed Critical Общество с ограниченной ответственностью "Яндекс Музыка"
Priority to US18/394,988 priority Critical patent/US20240232709A1/en
Publication of RU2022133953A publication Critical patent/RU2022133953A/en
Application granted granted Critical
Publication of RU2844072C2 publication Critical patent/RU2844072C2/en

Links

Abstract

FIELD: physics.
SUBSTANCE: invention relates to methods of generating recommendations of digital items for users of an online recommendation platform. Method includes generating synthesized user responses for new digital elements without an actual user response; formation includes: at the first stage – training the server of the evaluating machine learning model to determine the predicted indication of the user response for the digital element; and at a second step obtaining an indication of a novel digital element of a supplier of new elements, applying a machine learning evaluation model with respect to the new digital element to determine the indication of its synthesized user response and forming, based on the new digital elements with assigned indications on the synthesized user responses, a training data set for training the MLA algorithm.
EFFECT: high efficiency of the recommendation platform by solving the cold start problem.
20 cl, 10 dwg

Description

Область техники, к которой относится изобретениеField of technology to which the invention relates

[001] Настоящая технология в целом относится к рекомендательным системам и, в частности, к способу формирования обучающего набора данных для обучения алгоритма машинного обучения предоставлению рекомендаций элементов пользователям рекомендательной системы. [001] The present technology generally relates to recommender systems and, in particular, to a method for generating a training data set for training a machine learning algorithm to provide recommendations of elements to users of the recommender system.

Уровень техникиState of the art

[002] На рекомендательных онлайн-платформах размещаются различные цифровые элементы для их предоставления пользователям. Некоторые рекомендательные онлайн-платформы содержат сервисы потоковой трансляции, например, сервисы потокового аудио или видео, такие как сервис потокового аудио Spotify™, сервис потокового аудио Yandex.Music™, сервис потокового видео Netflix™, сервис потокового видео Amazon™ Prime Video и т.п., на которых размещены различные фонограммы и видеоклипы. Другие рекомендательные онлайн-платформы могут быть реализованы в виде платформ онлайн-списков, таких как платформа онлайн-списков Yandex.Market™, платформа онлайн-списков Amazon™, платформа онлайн-списков Ozon.ru™ и т.д., благодаря которым их пользователи могут приобретать различные товары и услуги в режиме «онлайн». Таким образом, различные поставщики элементов, такие как певцы, кинопродюсеры или интернет-магазины загружают миллионы или даже десятки миллионов цифровых элементов на рекомендательную онлайн-платформу для представления их пользователям. [002] Online recommendation platforms host various digital elements for provision to users. Some online recommendation platforms contain streaming services, such as audio or video streaming services such as the Spotify™ audio streaming service, the Yandex.Music™ audio streaming service, the Netflix™ video streaming service, the Amazon™ Prime Video streaming service, etc., which host various audio tracks and video clips. Other online recommendation platforms may be implemented as online listing platforms, such as the Yandex.Market™ online listing platform, the Amazon™ online listing platform, the Ozon.ru™ online listing platform, etc., through which their users can purchase various goods and services online. Thus, various element providers such as singers, film producers or online stores upload millions or even tens of millions of digital elements to the online recommendation platform to present them to users.

[003] Чтобы способствовать навигации пользователя среди такого количества цифровых элементов, размещенных на рекомендательной онлайн-платформе, и повысить удовлетворенность пользователя платформы от взаимодействия с ней, рекомендательная онлайн-платформа может предоставлять пользователю пользовательские рекомендации. Например, пользователь может оценивать на рекомендательной онлайн-платформе цифровой элемент, такой как фонограмма на сервисе потокового аудио, а рекомендательная онлайн-платформа может предоставлять после этого цифрового элемента рекомендуемый цифровой элемент для оценивания. В другом примере рекомендательная онлайн-платформа может определять и затем предоставлять рекомендуемые цифровые элементы пользователю в ответ на запуск пользователем рекомендательной онлайн-платформы на его электронном устройстве или в ответ на отправку общего запроса рекомендаций. Например, рекомендуемые цифровые элементы могут иметь схожую категорию или могут предоставляться тем же поставщиком. [003] In order to facilitate user navigation among such a number of digital items hosted on the online recommendation platform and to increase the user's satisfaction with the platform from interaction with it, the online recommendation platform may provide the user with user recommendations. For example, a user may rate a digital item on the online recommendation platform, such as a track on a streaming audio service, and the online recommendation platform may provide a recommended digital item for rating after this digital item. In another example, the online recommendation platform may determine and then provide recommended digital items to the user in response to the user launching the online recommendation platform on his electronic device or in response to sending a general request for recommendations. For example, the recommended digital items may be of a similar category or may be provided by the same provider.

[004] В общем случае для формирования индивидуальных пользовательских рекомендаций для пользователей такие рекомендательные онлайн-платформы могут выполнять специально обученный для этой цели алгоритм машинного обучения (MLA, Machine-Learning Algorithm). В частности, алгоритм MLA может быть обучен на основе обучающего набора данных, содержащего различные признаки, указывающие (а) на пользователей рекомендательной онлайн-платформы и/или (б) на размещенные на ней цифровые элементы и/или (в) на прошлые пользовательские действия пользователей с цифровыми элементами. Последние могут включать в себя пользовательские отклики, оставляемые пользователями для цифровых элементов после ознакомления с ними, такие как отзыв «Like» («Нравится») или «Dislike» («Не нравится»), комментарии и т.п. [004] In general, in order to generate individual user recommendations for users, such online recommendation platforms may execute a Machine-Learning Algorithm (MLA) specially trained for this purpose. In particular, the MLA algorithm may be trained based on a training dataset containing various features indicating (a) the users of the online recommendation platform and/or (b) the digital items posted thereon and/or (c) the past user actions of users with the digital items. The latter may include user responses left by users for the digital items after reviewing them, such as a “Like” or “Dislike” review, comments, etc.

[005] При этом новые цифровые элементы, загруженные на рекомендательную онлайн-платформу, могут не иметь некоторых признаков вследствие отсутствия предыдущих пользовательских откликов от пользователей и поэтому могут игнорироваться алгоритмом MLA при формировании пользовательских рекомендаций. В данной области техники эта проблема известна как проблема холодного старта, когда новые цифровые элементы не рекомендуются пользователям рекомендательной онлайн-платформы, поскольку другие пользователи еще не взаимодействовали с ними или не оценивали их. Следовательно, пользователи могут не получать релевантных пользовательских рекомендаций, содержащих новые цифровые элементы, а поставщики новых элементов могут не получать свою целевую аудиторию на рекомендательной онлайн-платформе. В результате возможно негативное влияние на удовлетворенность пользователя для обеих сторон. [005] In this case, new digital items uploaded to the online recommendation platform may lack some features due to the lack of previous user responses from users and may therefore be ignored by the MLA algorithm when generating user recommendations. In the art, this problem is known as the cold start problem, where new digital items are not recommended to users of the online recommendation platform because other users have not yet interacted with or rated them. Consequently, users may not receive relevant user recommendations containing new digital items, and providers of new items may not receive their target audience on the online recommendation platform. As a result, user satisfaction may be negatively affected for both parties.

[006] Для решения описанной выше технической проблемы предложены некоторые известные подходы. [006] To solve the technical problem described above, some well-known approaches have been proposed.

[007] В патентной заявке US 2006085818 A1 «Introducing new content items in a community-based recommendation system» (Koninklijke Philips NV, опубл. 20 апреля 2006 г.) описан способ работы с элементами контента, формирования профиля пользовательских предпочтений и представления новых элементов контента в рекомендательной системе на основе сообществ. При обнаружении доступности нового элемента контента виртуальный пользовательский терминал определяет новый профиль пользовательских предпочтений. Виртуальный пользовательский терминал содержит процессор инициализации, который задает для нового элемента контента значение предпочтения в профиле пользовательских предпочтений. Виртуальный пользовательский терминал дополнительно содержит процессор взаимосвязей, который определяет соответствующие элементы контента, и процессор профиля, который задает значения предпочтений в профиле пользовательских предпочтений, связанном с по меньшей мере одним элементом контента. Таким образом формируется взаимосвязь между первым элементом контента и упомянутыми элементами контента, в результате чего новый элемент контента связывается с имеющимися элементами контента и, следовательно, вероятность рекомендации нового элемента контента увеличивается.[007] In patent application US 2006085818 A1 "Introducing new content items in a community-based recommendation system" (Koninklijke Philips NV, published April 20, 2006) a method is described for working with content items, forming a user preference profile and presenting new content items in a community-based recommendation system. Upon detection of the availability of a new content item, a virtual user terminal determines a new user preference profile. The virtual user terminal comprises an initialization processor that sets a preference value for the new content item in the user preference profile. The virtual user terminal further comprises a relationship processor that determines the corresponding content items and a profile processor that sets the preference values in the user preference profile associated with at least one content item. In this way, a relationship is formed between the first content item and the said content items, as a result of which the new content item is associated with the existing content items and, consequently, the likelihood of recommending the new content item is increased.

[008] В патентной заявке CN 114238752 A «Article recommendation method and device and storage medium» (Hunan University, опубл. 25 марта 2022 г.) описан способ рекомендации элементов и оборудование, повышающие точность холодного старта. Способ включает в себя следующие шаги: определение мультимодальной информации для каждого объекта холодного старта из набора объектов холодного старта и мультимодальной информации для каждого объекта горячего старта из набора объектов горячего старта, при этом мультимодальная информация содержит по меньшей мере два элемента из числа идентификационной информации, характеристик визуальной информации, характеристик аудиоинформации и характеристик текстовой информации; выполнение иерархической кластеризации согласно мультимодальной информации каждого объекта холодного старта и каждого объекта горячего старта с целью получения множества результатов кластеризации; формирование дополнительного графа взаимодействий между каждым объектом холодного старта и каждым объектом горячего старта согласно множеству результатов кластеризации, при этом объект горячего старта соответствует набору объектов горячего старта; определение первого окончательного представления каждого объекта холодного старта и второго окончательного представления объекта горячего старта, соответствующего каждому объекту холодного старта согласно дополнительному графу взаимодействий; и рекомендацию каждого объекта холодного старта согласно первому окончательному представлению и второму окончательному представлению.[008] Patent application CN 114238752 A "Article recommendation method and device and storage medium" (Hunan University, published March 25, 2022) describes a method for recommending items and equipment that improve the accuracy of a cold start. The method includes the following steps: determining multimodal information for each cold start item in a set of cold start items and multimodal information for each hot start item in a set of hot start items, wherein the multimodal information comprises at least two items from among identification information, characteristics of visual information, characteristics of audio information, and characteristics of text information; performing hierarchical clustering according to the multimodal information of each cold start item and each hot start item to obtain a plurality of clustering results; forming an additional interaction graph between each cold start item and each hot start item according to the plurality of clustering results, wherein the hot start item corresponds to the set of hot start items; determining a first final representation of each cold start object and a second final representation of a hot start object corresponding to each cold start object according to the additional interaction graph; and recommending each cold start object according to the first final representation and the second final representation.

[009] В патенте CN 10833492 B «Personalized recommendation method based on combination of content and collaborative filtering» (Nanjing University of Posts and Telecommunications, выдан 2 ноября 2021 г.) описан способ персонализированных рекомендаций на основе сочетания контента и совместной фильтрации, который включает в себя два этапа обучения и персонализированных рекомендаций: на этапе обучения путем сбора данных формируется матрица предварительных рекомендаций «имеющийся пользователь»-«новый элемент»; на этапе персонализированных рекомендаций выполняется рекомендация элемента для нового пользователя и дополнительная рекомендация после формирования пользователем оценок. По сравнению с традиционным способом персонализированных рекомендаций данные способ и система позволяют решать проблему холодного старта, выполнять прогноз для вновь добавленных элементов, рекомендовать вновь добавленные элементы пользователю и использовать рекомендацию на основе совместной фильтрации после предварительной рекомендации таким образом, чтобы повысить разнообразие и правильность рекомендуемых элементов. Кроме того, благодаря формированию виртуальных пользователей с помощью алгоритма кластеризации значительно уменьшается размер матрицы и снижается сложность расчетов. [009] Patent CN 10833492 B "Personalized recommendation method based on combination of content and collaborative filtering" (Nanjing University of Posts and Telecommunications, issued on November 2, 2021) discloses a personalized recommendation method based on a combination of content and collaborative filtering, which includes two stages of training and personalized recommendation: in the training stage, an "existing user" - "new item" preliminary recommendation matrix is formed by collecting data; in the personalized recommendation stage, an item is recommended for a new user and an additional recommendation is made after the user has generated ratings. Compared with the traditional personalized recommendation method, this method and system can solve the cold start problem, perform a prediction for newly added items, recommend the newly added items to the user, and use the recommendation based on collaborative filtering after the preliminary recommendation, so as to improve the diversity and correctness of the recommended items. In addition, by generating virtual users through a clustering algorithm, the matrix size is significantly reduced and the calculation complexity is reduced.

Раскрытие изобретенияDisclosure of invention

[010] В связи с изложенным требуются системы и способы, позволяющие избегать, уменьшать или преодолевать ограничения известных технологий. [010] In connection with the above, systems and methods are needed that allow one to avoid, reduce or overcome the limitations of known technologies.

[011] Разработчики настоящей технологии разработали способы и системы для решения проблемы холодного старта для новых цифровых элементов, загруженных на рекомендательную онлайн-платформу. В частности, разработчики разработали способы и системы для формирования синтезированных пользовательских откликов для новых цифровых элементов на основе фактического пользовательского отклика, предоставленного для имеющихся старых цифровых элементов рекомендательной онлайн-платформы ее пользователями. [011] The developers of the present technology have developed methods and systems for solving the cold start problem for new digital items uploaded to the online recommendation platform. In particular, the developers have developed methods and systems for generating synthesized user responses for new digital items based on the actual user response provided for existing old digital items of the online recommendation platform by its users.

[012] В некоторых не имеющих ограничительного характера вариантах осуществления данной технологии настоящие способы и системы предназначены для обучения оценивающей модели машинного обучения (ML, Machine Learning) определению синтезированных пользовательских откликов для назначения новым цифровым элементам. В частности, в этих вариантах осуществления изобретения оценивающая модель ML обучается воспроизведению текущего распределения откликов для указаний на фактические пользовательские отклики, предоставленные для старых цифровых элементов, например, такие как положительные и отрицательные отзывы. [012] In some non-limiting embodiments of the present technology, the present methods and systems are designed to train a Machine Learning (ML) scoring model to determine synthesized user responses to assign to new digital items. In particular, in these embodiments of the invention, the ML scoring model is trained to reproduce the current distribution of responses to indicate actual user responses provided for old digital items, such as positive and negative reviews, for example.

[013] Согласно по меньшей мере другим не имеющим ограничительного характера вариантам осуществления настоящей технологии, синтезированные пользовательские отклики для новых цифровых элементов, загруженных на рекомендательную онлайн-платформу поставщиком новых элементов, могут имитировать фактические пользовательские отклики, предоставленные для старых цифровых элементов поставщика старых элементов, подобного поставщику новых элементов. В этой связи в этих вариантах осуществления изобретения настоящие способы и системы предназначены (а) для определения текущего распределения откликов для указаний на фактические пользовательские отклики, предоставленные для старых цифровых элементов поставщика старых элементов, и (б) для назначения указаний на синтезированные пользовательские отклики для новых цифровых элементов согласно определенному таким образом текущему распределению откликов. [013] According to at least other non-limiting embodiments of the present technology, the synthesized user responses for new digital items uploaded to the online recommendation platform by a provider of new items may mimic the actual user responses provided for old digital items of a provider of old items similar to the provider of new items. In this regard, in these embodiments of the invention, the present methods and systems are intended to (a) determine a current distribution of responses for indications of actual user responses provided for old digital items of a provider of old items, and (b) to assign indications to the synthesized user responses for new digital items according to the current distribution of responses thus determined.

[014] Новые цифровые элементы с такими синтезированными пользовательскими откликами рассматриваются алгоритмом MLA рекомендательной онлайн-платформы и за счет этого могут получать пользовательские рекомендации для пользователей. Таким образом, способы, описанные в настоящем документе, способны обеспечивать лучшее представление новых цифровых элементов пользователям рекомендательной онлайн-платформы, позволяя новым цифровым элементам получать фактические пользовательские отклики, которые (если они отличаются) могут в дальнейшем заменять синтезированные пользовательские отклики. [014] New digital items with such synthesized user responses are considered by the MLA algorithm of the online recommendation platform and can thereby obtain user recommendations for users. Thus, the methods described in this document are able to provide a better presentation of new digital items to users of the online recommendation platform, allowing new digital items to obtain actual user responses, which (if different) can subsequently replace the synthesized user responses.

[015] Следовательно, различные не имеющие ограничительного характера варианты осуществления настоящей технологии позволяют повышать удовлетворенность пользователей и поставщиков элементов рекомендательных онлайн-платформ. [015] Therefore, various non-limiting embodiments of the present technology can improve the satisfaction of users and providers of elements of online recommendation platforms.

[016] В частности, согласно первому аспекту настоящей технологии реализован способ формирования обучающего набора данных для обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы. Рекомендательная онлайн-платформа содержит множество цифровых элементов. Множество цифровых элементов содержит: (1) старую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу одним из множества поставщиков старых элементов, при этом по меньшей мере некоторые старые цифровые элементы из старой части цифровых элементов получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы, а указания на пользовательские отклики по меньшей мере некоторых старых цифровых элементов распределены в старой части цифровых элементов согласно распределению откликов; и (2) новую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу поставщиком новых элементов из множества поставщиков новых элементов и не имеет пользовательского отклика. Формирование обучающего набора данных включает в себя формирование синтезированных пользовательских откликов для новых цифровых элементов. Способ выполняется сервером, на котором размещена рекомендательная онлайн-платформа. Способ включает в себя: на первом этапе - обучение сервером оценивающей модели ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента, при этом обучение включает в себя получение сервером указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом, ввод сервером множества цифровых объектов для оценивания в оценивающую модель ML и обучение таким образом оценивающей модели ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных; на втором этапе, следующем за первым этапом, - получение сервером указания на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов; применение сервером оценивающей модели ML в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента; формирование сервером обучающего набора данных, содержащего множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и ввод сервером множества обучающих цифровых объектов в алгоритм MLA для обучения алгоритма MLA формированию рекомендаций цифровых элементов. [016] In particular, according to the first aspect of the present technology, a method is implemented for generating a training data set for training an MLA algorithm to generate recommendations of digital items for users of an online recommendation platform. The online recommendation platform contains a plurality of digital items. The plurality of digital items contains: (1) an old portion of the digital items, each of which was uploaded to the online recommendation platform by one of a plurality of old item providers, wherein at least some of the old digital items from the old portion of the digital items received a user response from at least one user of the online recommendation platform, and indications of user responses of at least some of the old digital items are distributed in the old portion of the digital items according to a distribution of responses; and (2) a new portion of the digital items, each of which was uploaded to the online recommendation platform by a new item provider from a plurality of new item providers and does not have a user response. Generating the training data set includes generating synthesized user responses for the new digital items. The method is performed by a server hosting the online recommendation platform. The method comprises: at a first stage - training by a server of an ML evaluation model to determine a predicted indication of a user response for a digital item, wherein the training comprises receiving by the server indications of an old part of digital items in order to form a plurality of training digital objects for evaluation, each of which contains (a) an old digital item from the old part of digital items and (b) an indication of a user response received by the old digital item, input by the server of a plurality of digital objects for evaluation into the ML evaluation model and thus training the ML evaluation model to determine a predicted indication of a user response for a digital item using the distribution of responses for indications of user responses in the old part of digital items as actual data; at a second stage, following the first stage - receiving by the server an indication of a supplier of new items from a plurality of suppliers of new items who has uploaded a plurality of new digital items from the new part of digital items to the online recommendation platform; applying by the server of the ML evaluation model in relation to a new digital item from a plurality of new digital items of the supplier of new items in order to determine an indication of a synthesized user response for the new digital item; generating by the server a training data set containing a plurality of training digital objects, wherein the training digital object contains (a) one of a plurality of new digital elements of a supplier of new elements and (b) an indication of a synthesized user response; and inputting by the server the plurality of training digital objects into an MLA algorithm for training the MLA algorithm to generate recommendations of digital elements.

[017] В некоторых вариантах осуществления способа применение оценивающей модели ML включает в себя определение первого значения вероятности получения указания на положительный пользовательский отклик новым цифровым элементом поставщика новых цифровых элементов, при этом определение основано на оценке сходства поставщика новых элементов со множеством поставщиков старых элементов. [017] In some embodiments of the method, using the ML scoring model includes determining a first value of the probability of receiving an indication of a positive user response by a new digital item of a supplier of new digital items, wherein the determination is based on an assessment of the similarity of the supplier of new items with a plurality of suppliers of old items.

[018] В некоторых вариантах осуществления способа первое значение вероятности определяется по формуле: [018] In some embodiments of the method, the first probability value is determined by the formula:

, ,

где artistScore - оценка сходства поставщика новых элементов со множеством поставщиков старых элементов, a и b - коэффициенты, определенные путем обучения оценивающей модели машинного обучения. where artistScore is the similarity score of the new item supplier to the set of old item suppliers, a and b are coefficients determined by training the machine learning scoring model.

[019] В некоторых вариантах осуществления способа он дополнительно включает в себя определение сервером оценки сходства поставщика новых элементов со множеством поставщиков старых элементов. [019] In some embodiments of the method, it further includes determining, by the server, an estimate of the similarity of the supplier of the new items with the plurality of suppliers of the old items.

[020] В некоторых вариантах осуществления способа определение оценки сходства поставщика новых элементов включает в себя: получение для поставщика старых элементов из множества поставщиков старых элементов значения параметра сходства поставщика старых элементов с поставщиком новых элементов; формирование сервером на основе значений параметра сходства каждого поставщика из множества поставщиков старых элементов с поставщиком новых элементов ориентированной графовой структуры, где вершина ориентированной графовой структуры представляет поставщика элементов из множества поставщиков старых элементов или из множества поставщиков новых элементов, а ребро, соединяющее пару вершин, представляет ненулевое значение параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов; определение сервером для ребра весового значения, указывающего на значение параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов; и определение сервером оценки сходства поставщика новых элементов в качестве максимального суммарного весового значения при переходе от вершины ориентированной графовой структуры, связанной с поставщиком новых элементов, к ее начальной вершине. [020] In some embodiments of the method, determining a similarity score of a supplier of new elements includes: obtaining, for a supplier of old elements from a plurality of suppliers of old elements, a value of a similarity parameter of the supplier of old elements with a supplier of new elements; generating, by a server, based on the values of the similarity parameter of each supplier from the plurality of suppliers of old elements with a supplier of new elements, a directed graph structure, where a vertex of the directed graph structure represents a supplier of elements from the plurality of suppliers of old elements or from the plurality of suppliers of new elements, and an edge connecting a pair of vertices represents a non-zero value of the similarity parameter of the supplier of new elements with one of the plurality of suppliers of old elements; determining, by the server, for the edge, a weight value indicating the value of the similarity parameter of the supplier of new elements with one of the plurality of suppliers of old elements; and determining, by the server, the similarity score of the supplier of new elements as the maximum total weight value when moving from the vertex of the directed graph structure associated with the supplier of new elements to its initial vertex.

[021] В некоторых вариантах осуществления способа определение весового значения включает в себя определение обратного значения для значения параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов. [021] In some embodiments of the method, determining the weight value includes determining the inverse value for the similarity parameter value of the supplier of new items with one of the plurality of suppliers of old items.

[022] В некоторых вариантах осуществления способа параметр сходства представляет собой степень сходства поставщика новых элементов с каждым из множества поставщиков старых элементов. [022] In some embodiments of the method, the similarity parameter represents a degree of similarity of the supplier of new elements with each of the plurality of suppliers of old elements.

[023] В некоторых вариантах осуществления способа он дополнительно включает в себя получение от оценщика-человека степени сходства поставщика новых элементов с каждым из множества поставщиков старых элементов. [023] In some embodiments of the method, it further includes receiving from the human evaluator a degree of similarity of the supplier of the new items to each of the plurality of suppliers of the old items.

[024] В некоторых вариантах осуществления способа применение оценивающей модели ML дополнительно включает в себя определение второго значения вероятности получения указания на положительный пользовательский отклик новым цифровым элементом поставщика новых цифровых элементов, при этом определение основано на значении популярности нового цифрового элемента в данной области. [024] In some embodiments of the method, applying the ML evaluation model further includes determining a second value of the probability of receiving an indication of a positive user response for the new digital item of the provider of the new digital items, wherein the determination is based on a value of the popularity of the new digital item in the given area.

[025] В некоторых вариантах осуществления способа второе значение вероятности определяется по формуле: [025] In some embodiments of the method, the second probability value is determined by the formula:

, ,

где Popularity - значение популярности нового цифрового элемента в данной области, maxPopularity - значение популярности наиболее популярного в данной области нового цифрового элемента из соответствующего множества цифровых элементов поставщика новых элементов, minPopularity - значение популярности наименее популярного в данной области нового цифрового элемента из соответствующего множества цифровых элементов поставщика новых элементов, c и d - коэффициенты, определенные путем обучения оценивающей модели машинного обучения. where Popularity is the popularity value of a new digital element in a given area, maxPopularity is the popularity value of the most popular new digital element in a given area from the corresponding set of digital elements of the supplier of new elements, minPopularity is the popularity value of the least popular new digital element in a given area from the corresponding set of digital elements of the supplier of new elements, c and d are coefficients determined by training the evaluating machine learning model.

[026] В некоторых вариантах осуществления способа новый цифровой элемент представляет собой аудиопоток, а значение популярности нового цифрового элемента указывает на по меньшей мере одно из следующего: (а) количество потоков аудиопотока на медиа-ресурсе, (б) количество запросов на воспроизведение аудиопотока на медиа-ресурсе, (в) позиция аудиопотока в хит-параде и (г) количество проданных альбомов, содержащих аудиопоток. [026] In some embodiments of the method, the new digital item is an audio stream, and the popularity value of the new digital item indicates at least one of the following: (a) the number of streams of the audio stream on the media resource, (b) the number of requests to play the audio stream on the media resource, (c) the position of the audio stream in the hit parade, and (d) the number of albums sold containing the audio stream.

[027] В некоторых вариантах осуществления способа он дополнительно включает в себя назначение сервером новому цифровому элементу указания на положительный синтезированный пользовательский отклик, если первое и/или второе значение вероятности больше верхнего порога вероятности, и назначение сервером новому цифровому элементу указания на отрицательный синтезированный пользовательский отклик, если первое и/или второе значение вероятности меньше нижнего порога вероятности, который меньше верхнего порога вероятности. [027] In some embodiments of the method, it further includes assigning by the server to the new digital element an indication of a positive synthesized user response if the first and/or second probability value is greater than an upper probability threshold, and assigning by the server to the new digital element an indication of a negative synthesized user response if the first and/or second probability value is less than a lower probability threshold, which is less than the upper probability threshold.

[028] В некоторых вариантах осуществления способа он перед применением оценивающей модели ML дополнительно включает в себя выбор сервером нового цифрового элемента из множества новых цифровых элементов. [028] In some embodiments of the method, before applying the ML evaluation model, it further includes the server selecting a new digital element from a plurality of new digital elements.

[029] В некоторых вариантах осуществления способа этот выбор включает в себя выбор нового цифрового элемента из множества новых цифровых элементов одним из следующих способов: (а) случайным образом, (б) с использованием равномерных вероятностей выбора, (в) с использованием значения вероятности выбора, пропорционального значению популярности нового цифрового элемента в данной области, и (г) с использованием значения вероятности выбора, пропорционального квадратному корню из значения популярности нового цифрового элемента в данной области. [029] In some embodiments of the method, this selection includes selecting a new digital item from a plurality of new digital items in one of the following ways: (a) randomly, (b) using uniform selection probabilities, (c) using a selection probability value proportional to a popularity value of the new digital item in the given area, and (d) using a selection probability value proportional to the square root of the popularity value of the new digital item in the given area.

[030] В некоторых вариантах осуществления способа этот выбор и применение выполняются итеративно в течение заранее заданного количества итераций перед формированием обучающего набора данных. [030] In some embodiments of the method, this selection and application is performed iteratively for a predetermined number of iterations before forming the training data set.

[031] В некоторых вариантах осуществления способа он дополнительно включает в себя обновление сервером обучающего цифрового объекта из множества обучающих цифровых объектов путем замены в нем указания на синтезированный пользовательский отклик указанием на пользовательский отклик, если сервер определил, что новый цифровой элемент из множества новых цифровых элементов получил пользовательский отклик. [031] In some embodiments of the method, it further includes updating by the server the training digital object from the plurality of training digital objects by replacing therein the indication of the synthesized user response with an indication of the user response if the server has determined that a new digital element from the plurality of new digital elements has received a user response.

[032] В некоторых вариантах осуществления способа оценивающая модель ML представляет собой модель ML матричной факторизации. [032] In some embodiments of the method, the ML estimation model is a matrix factorization ML model.

[033] В некоторых вариантах осуществления способа алгоритм MLA представляет собой алгоритм MLA на основе деревьев решений, алгоритм MLA на основе трансформера или алгоритм MLA на основе глубокого семантического сходства. [033] In some embodiments of the method, the MLA algorithm is a decision tree-based MLA algorithm, a transformer-based MLA algorithm, or a deep semantic similarity-based MLA algorithm.

[034] Согласно второму аспекту настоящей технологии реализован способ формирования обучающего набора данных для обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы. Рекомендательная онлайн-платформа содержит множество цифровых элементов. Формирование обучающего набора данных включает в себя формирование синтезированных пользовательских откликов для новых цифровых элементов. Способ выполняется сервером, на котором размещена рекомендательная онлайн-платформа. Способ включает в себя: получение сервером указания на поставщика новых элементов из числа поставщиков новых элементов, имеющего множество новых цифровых элементов, подлежащих загрузке на рекомендательную онлайн-платформу, при этом новый цифровой элемент из множества новых цифровых элементов не имеет полученного ранее пользовательского отклика; получение сервером указания на множество поставщиков старых элементов, загрузивших множество старых цифровых элементов, по меньшей мере некоторые из которых получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы; анализ сервером поставщика новых элементов и множества поставщиков старых элементов с целью определения эталонного поставщика старых элементов на основе параметра сходства поставщика новых элементов с каждым из множества поставщиков старых элементов; основанное на пользовательских откликах, полученных множеством старых цифровых элементов эталонного поставщика старых элементов, определение сервером синтезированных пользовательских откликов для множества новых цифровых элементов поставщика новых элементов, включающее в себя определение сервером распределения откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов, и назначение сервером указаний на синтезированные пользовательские отклики множеству новых цифровых элементов поставщика новых элементов согласно распределению откликов для указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов; формирование сервером обучающего набора данных, содержащего множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и ввод сервером множества обучающих цифровых объектов в алгоритм MLA для обучения алгоритма MLA формированию рекомендаций цифровых элементов. [034] According to a second aspect of the present technology, a method for generating a training data set for training an MLA algorithm to generate recommendations of digital items for users of an online recommendation platform is implemented. The online recommendation platform contains a plurality of digital items. Generating the training data set includes generating synthesized user responses for new digital items. The method is performed by a server on which the online recommendation platform is hosted. The method includes: the server receiving an indication of a supplier of new items from among the suppliers of new items that has a plurality of new digital items to be uploaded to the online recommendation platform, wherein the new digital item from the plurality of new digital items does not have a previously received user response; the server receiving an indication of a plurality of suppliers of old items that have uploaded a plurality of old digital items, at least some of which have received a user response from at least one user of the online recommendation platform; the server analyzing the supplier of new items and the plurality of suppliers of old items in order to determine a reference supplier of old items based on the similarity parameter of the supplier of new items with each of the plurality of suppliers of old items; based on user responses received by a plurality of old digital items of a reference supplier of old items, determining by a server synthesized user responses for a plurality of new digital items of a supplier of new items, including determining by the server a distribution of responses for indications of user responses in a plurality of old digital items associated with the reference supplier of old items, and assigning by the server indications of the synthesized user responses to the plurality of new digital items of the supplier of new items according to the distribution of responses for indications of user responses in a plurality of old digital items of the reference supplier of old items; generating by the server a training data set comprising a plurality of training digital objects, wherein the training digital object comprises (a) one of a plurality of new digital items of the supplier of new items and (b) an indication of the synthesized user response; and inputting by the server the plurality of training digital objects into an MLA algorithm for training the MLA algorithm to generate recommendations of digital items.

[035] Согласно третьему аспекту настоящей технологии реализован сервер для формирования обучающего набора данных с целью обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, размещенной на сервере. Рекомендательная онлайн-платформа содержит множество цифровых элементов. Множество цифровых элементов содержит (1) старую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу одним из множества поставщиков старых элементов, при этом по меньшей мере некоторые старые цифровые элементы из старой части цифровых элементов получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы, а указания на пользовательские отклики по меньшей мере некоторых старых цифровых элементов распределены в старой части цифровых элементов согласно распределению откликов, и (2) новую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу поставщиком новых элементов из множества поставщиков новых элементов и не имеет пользовательского отклика. Формирование включает в себя формирование синтезированных пользовательских откликов для новых цифровых элементов. Сервер содержит процессор и машиночитаемую физическую память, хранящую команды. Процессор при исполнении команд способен: на первом этапе - обучать оценивающую модель ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента путем получения указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом, и ввода множества цифровых объектов для оценивания в оценивающую модель ML и обучения таким образом оценивающей модели ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных; на втором этапе, следующем за первым - получать указание на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов, и применять оценивающую модель ML в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента; формировать обучающий набор данных, содержащий множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и вводить множество обучающих цифровых объектов в алгоритм MLA для обучения алгоритма MLA формированию рекомендаций цифровых элементов. [035] According to a third aspect of the present technology, a server is implemented for generating a training data set for the purpose of training an MLA algorithm to generate recommendations of digital items for users of an online recommendation platform hosted on the server. The online recommendation platform contains a plurality of digital items. The plurality of digital items contains (1) an old portion of the digital items, each of which was uploaded to the online recommendation platform by one of a plurality of old item providers, wherein at least some of the old digital items from the old portion of the digital items received a user response from at least one user of the online recommendation platform, and indications of user responses of at least some of the old digital items are distributed in the old portion of the digital items according to a distribution of responses, and (2) a new portion of the digital items, each of which was uploaded to the online recommendation platform by a new item provider from a plurality of new item providers and does not have a user response. The generating includes generating synthesized user responses for the new digital items. The server contains a processor and a machine-readable physical memory storing instructions. When executing commands, the processor is capable of: at the first stage - training the ML evaluation model to determine the predicted indication of the user response for the digital item by receiving indications of the old part of the digital items in order to form a plurality of training digital objects for evaluation, each of which contains (a) the old digital item from the old part of the digital items and (b) an indication of the user response received by the old digital item, and inputting the plurality of digital objects for evaluation into the ML evaluation model and thereby training the ML evaluation model to determine the predicted indication of the user response for the digital item using the distribution of responses for indications of the user responses in the old part of the digital items as actual data; at the second stage following the first - receiving an indication of a supplier of new items from a plurality of suppliers of new items who has uploaded a plurality of new digital items from the new part of the digital items to the online recommendation platform, and applying the ML evaluation model in relation to the new digital item from the plurality of new digital items of the supplier of new items in order to determine the indication of the synthesized user response for the new digital item; generate a training data set comprising a plurality of training digital objects, wherein the training digital object comprises (a) one of a plurality of new digital items of a supplier of new items and (b) an indication of a synthesized user response; and input the plurality of training digital objects into an MLA algorithm for training the MLA algorithm to generate recommendations for digital items.

[036] В контексте настоящего описания термин «сервер» означает компьютерную программу, выполняемую соответствующими аппаратными средствами и способную принимать запросы (например, от электронных устройств) через сеть и выполнять эти запросы или инициировать их выполнение. Аппаратные средства могут представлять собой один физический компьютер или одну компьютерную систему, что не существенно для настоящей технологии. В настоящем контексте выражение «сервер» не означает, что каждая задача (например, принятая команда или запрос) или некоторая конкретная задача принимается, выполняется или запускается одним и тем же сервером (т.е. одними и теми же программными и/или аппаратными средствами). Это выражение означает, что любое количество программных средств или аппаратных средств может принимать, отправлять, выполнять или инициировать выполнение любой задачи или запроса либо результатов любых задач или запросов. Все эти программные и аппаратные средства могут представлять собой один сервер или несколько серверов, причем оба эти случая подразумеваются в выражении «по меньшей мере один сервер».[036] In the context of the present description, the term "server" means a computer program executed by appropriate hardware and capable of receiving requests (e.g. from electronic devices) via a network and executing or causing these requests to be executed. The hardware may be one physical computer or one computer system, which is not essential for the present technology. In the present context, the expression "server" does not mean that every task (e.g. received command or request) or some specific task is received, executed or started by the same server (i.e. the same software and/or hardware). This expression means that any number of software or hardware can receive, send, execute or cause to be executed any task or request or the results of any tasks or requests. All of these software and hardware may represent one server or several servers, and both of these cases are implied in the expression "at least one server".

[037] В контексте настоящего описания термин «электронное устройство» означает любое компьютерное аппаратное средство, способное выполнять программы, подходящие для решения поставленной задачи. В контексте настоящего описания термин «электронное устройство» подразумевает, что устройство может функционировать в качестве сервера для других электронных устройств, тем не менее, это не обязательно для настоящей технологии. Таким образом, некоторые (не имеющие ограничительного характера) примеры электронных устройств включают в себя блок автономного вождения, персональные компьютеры (настольные, ноутбуки, нетбуки и т.п.), смартфоны и планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Должно быть понятно, что в настоящем контексте тот факт, что устройство функционирует в качестве электронного устройства, не означает, что оно не может функционировать в качестве сервера для других электронных устройств. [037] In the context of the present description, the term "electronic device" means any computer hardware capable of executing programs suitable for solving a given task. In the context of the present description, the term "electronic device" implies that the device can function as a server for other electronic devices, however, this is not necessary for the present technology. Thus, some (non-limiting) examples of electronic devices include an autonomous driving unit, personal computers (desktops, laptops, netbooks, etc.), smartphones and tablets, as well as network equipment such as routers, switches and gateways. It should be understood that in the present context, the fact that a device functions as an electronic device does not mean that it cannot function as a server for other electronic devices.

[038] В контексте настоящего описания выражение «информация» включает в себя информацию любого рода или вида, допускающую хранение в базе данных. Таким образом, информация включает в себя визуальные произведения (например, карты), аудиовизуальные произведения (например, изображения, фильмы, звукозаписи, презентации и т.д.), данные (например, данные о местоположении, метеорологические данные, данные о дорожном движении, числовые данные и т.д.), текст (например, мнения, комментарии, вопросы, сообщения и т.д.), документы, электронные таблицы и т.д., но не ограничивается ими.[038] In the context of the present description, the term "information" includes information of any kind or type capable of being stored in a database. Thus, information includes, but is not limited to, visual works (e.g., maps), audiovisual works (e.g., images, films, sound recordings, presentations, etc.), data (e.g., location data, weather data, traffic data, numerical data, etc.), text (e.g., opinions, comments, questions, messages, etc.), documents, spreadsheets, etc.

[039] В контексте настоящего описания термин «база данных» означает любой структурированный набор данных, независимо от его конкретной структуры, программного обеспечения для управления базой данных или компьютерных аппаратных средств для хранения этих данных, их применения или обеспечения их использования иным способом. База данных может располагаться в тех же аппаратных средствах, где реализован процесс, обеспечивающий хранение или использование информации, хранящейся в базе данных, либо база данных может располагаться в отдельных аппаратных средствах, таких как специализированный сервер или множество серверов.[039] As used herein, the term "database" means any structured collection of data, regardless of its specific structure, database management software, or computer hardware for storing, using, or otherwise enabling the use of that data. A database may be located on the same hardware as the process that enables the storage or use of the information stored in the database, or the database may be located on separate hardware, such as a dedicated server or multiple servers.

[040] В контексте настоящего описания числительные «первый», «второй», «третий» и т.д. используются лишь для указания на различие между существительными, к которым они относятся, но не для описания каких-либо определенных взаимосвязей между этими существительными. Кроме того, как встречается в настоящем описании в другом контексте, ссылка на «первый» элемент и «второй» элемент не исключает того, что эти два элемента в действительности могут быть одним и тем же элементом. [040] In the context of the present description, the numerals "first," "second," "third," etc. are used merely to indicate a distinction between the nouns to which they refer, but not to describe any specific relationship between those nouns. Furthermore, as occurs in another context in the present description, reference to a "first" element and a "second" element does not exclude the possibility that these two elements may in fact be the same element.

[041] Каждый вариант осуществления настоящей технологии относится к по меньшей мере одной из вышеупомянутых целей и/или к одному из вышеупомянутых аспектов, но не обязательно ко всем ним. Должно быть понятно, что некоторые аспекты настоящей технологии, связанные с попыткой достижения вышеупомянутой цели, могут не соответствовать этой цели и/или могут соответствовать другим целям, явным образом здесь не упомянутым.[041] Each embodiment of the present technology relates to at least one of the above-mentioned objectives and/or to one of the above-mentioned aspects, but not necessarily to all of them. It should be understood that some aspects of the present technology associated with an attempt to achieve the above-mentioned objective may not correspond to this objective and/or may correspond to other objectives not explicitly mentioned herein.

[042] Дополнительные и/или альтернативные признаки, аспекты и преимущества вариантов осуществления настоящей технологии содержатся в дальнейшем описании, на приложенных чертежах и в формуле изобретения.[042] Additional and/or alternative features, aspects and advantages of embodiments of the present technology are contained in the following description, in the attached drawings and in the claims.

Краткое описание чертежейBrief description of the drawings

[043] Эти и другие признаки, аспекты и преимущества настоящей технологии поясняются в дальнейшем описании, в приложенной формуле изобретения и на следующих чертежах.[043] These and other features, aspects and advantages of the present technology are explained in the following description, in the appended claims and in the following drawings.

[044] На фиг. 1 приведена схема иллюстративной компьютерной системы, которая может быть использована для реализации некоторых не имеющих ограничительного характера вариантов осуществления настоящей технологии.[044] Fig. 1 is a diagram of an illustrative computer system that may be used to implement certain non-limiting embodiments of the present technology.

[045] На фиг. 2 приведена схема сетевой вычислительной среды, содержащей компьютерную систему, представленную на фиг. 1, и пригодной для использования с некоторыми не имеющими ограничительного характера вариантами осуществления настоящей технологии.[045] Fig. 2 is a diagram of a network computing environment comprising the computer system of Fig. 1 and suitable for use with certain non-limiting embodiments of the present technology.

[046] На фиг. 3 приведено схематическое изображение графического интерфейса пользователя (GUI, Graphical User Interface) рекомендательной онлайн-платформы, размещенной на сервере в сетевой вычислительной среде, представленной на фиг. 2, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.[046] Fig. 3 is a schematic diagram of a graphical user interface (GUI) of an online recommendation platform hosted on a server in the network computing environment shown in Fig. 2, according to some non-limiting embodiments of the present technology.

[047] На фиг. 4A и 4Б приведены схематические изображения структуры входных и выходных данных оценивающей модели ML, которая используется сервером сетевой вычислительной среды, представленной на фиг. 2, для определения прогнозируемых указаний на пользовательские отклики для множества цифровых элементов рекомендательной онлайн-платформы, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. [047] Fig. 4A and 4B are schematic diagrams of the structure of input and output data of the ML evaluation model that is used by the server of the network computing environment shown in Fig. 2 to determine predicted user response indications for a plurality of digital elements of the online recommendation platform, according to some non-limiting embodiments of the present technology.

[048] На фиг. 5 приведено схематическое изображение графа сходства поставщиков элементов для поставщиков множества цифровых элементов, размещенных на рекомендательной онлайн-платформе, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. [048] Fig. 5 is a schematic diagram of a similarity graph of item suppliers for suppliers of a plurality of digital items hosted on an online recommendation platform, according to some non-limiting embodiments of the present technology.

[049] На фиг. 6 приведено схематическое изображение шага для определения сходства нового и старого поставщиков элементов из множества цифровых элементов, размещенных на рекомендательной онлайн-платформе, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.[049] Fig. 6 is a schematic diagram of a step for determining the similarity of a new and old supplier of items from a plurality of digital items hosted on an online recommendation platform, according to some non-limiting embodiments of the present technology.

[050] На фиг. 7 приведена схема архитектуры модели машинного обучения, используемой для реализации по меньшей мере некоторых не имеющих ограничительного характера вариантов осуществления настоящей технологии. [050] Fig. 7 is a diagram of the architecture of a machine learning model used to implement at least some non-limiting embodiments of the present technology.

[051] На фиг. 8 приведена схема первого способа формирования сервером из сетевой вычислительной среды, представленной на фиг. 2, обучающего набора данных для обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.[051] Fig. 8 shows a diagram of a first method for generating by a server from the network computing environment shown in Fig. 2 a training data set for training the MLA algorithm to generate recommendations of digital elements for users of the online recommendation platform, according to some non-limiting embodiments of the present technology.

[052] На фиг. 9 приведена схема второго способа формирования сервером из сетевой вычислительной среды, представленной на фиг. 2, обучающего набора данных для обучения алгоритма MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. [052] Fig. 9 shows a diagram of a second method for the server to generate, from the network computing environment shown in Fig. 2, a training data set for training the MLA algorithm to generate recommendations of digital elements for users of the online recommendation platform, according to some non-limiting embodiments of the present technology.

Осуществление изобретенияImplementation of the invention

[053] Представленные здесь примеры и условный язык предназначены для обеспечения лучшего понимания принципов настоящей технологии, а не для ограничения ее объема до таких специально приведенных примеров и условий. Очевидно, что специалисты в данной области техники способны разработать различные способы и устройства, которые явно не описаны и не показаны, но реализуют принципы настоящей технологии в пределах ее существа и объема. [053] The examples and conventional language provided herein are intended to provide a better understanding of the principles of the present technology, and not to limit its scope to such specifically provided examples and conditions. It is obvious that those skilled in the art are capable of devising various methods and devices that are not explicitly described or shown, but implement the principles of the present technology within its spirit and scope.

[054] Кроме того, чтобы способствовать лучшему пониманию, последующее описание может содержать упрощенные варианты реализации настоящей технологии. Специалистам в данной области должно быть понятно, что другие варианты осуществления настоящей технологии могут быть значительно сложнее.[054] Furthermore, in order to facilitate better understanding, the following description may contain simplified embodiments of the present technology. Those skilled in the art will understand that other embodiments of the present technology may be significantly more complex.

[055] В некоторых случаях приводятся полезные примеры модификаций настоящей технологии. Они способствуют пониманию, но также не определяют объема или границ настоящей технологии. Представленный перечень модификаций не является исчерпывающим и специалист в данной области может разработать другие модификации в пределах объема настоящей технологии. Кроме того, если в некоторых случаях модификации не описаны, это не означает, что они невозможны и/или что описание содержит единственно возможный вариант реализации того или иного элемента настоящей технологии.[055] In some cases, useful examples of modifications of the present technology are given. They facilitate understanding, but also do not define the scope or boundaries of the present technology. The presented list of modifications is not exhaustive and a person skilled in the art can develop other modifications within the scope of the present technology. In addition, if in some cases modifications are not described, this does not mean that they are impossible and/or that the description contains the only possible embodiment of a particular element of the present technology.

[056] Более того, описание принципов, аспектов и вариантов реализации настоящей технологии, а также их конкретные примеры предназначены для охвата их структурных и функциональных эквивалентов, независимо от того, известны они в настоящее время или будут разработаны в будущем. Например, специалистам в данной области техники должно быть понятно, что любые описанные здесь структурные схемы соответствуют концептуальным представлениям иллюстративных принципиальных схем, реализующих основы настоящей технологии. Также должно быть понятно, что любые блок-схемы, схемы процессов, диаграммы изменения состояния, псевдокоды и т.п. соответствуют различным процессам, которые могут быть представлены на машиночитаемом физическом носителе информации и могут выполняться компьютером или процессором, независимо от того, показан такой компьютер или процессор явно или нет.[056] Moreover, the description of the principles, aspects and embodiments of the present technology, as well as specific examples thereof, are intended to cover their structural and functional equivalents, regardless of whether they are currently known or will be developed in the future. For example, those skilled in the art should understand that any block diagrams described herein correspond to conceptual representations of illustrative circuit diagrams implementing the principles of the present technology. It should also be understood that any block diagrams, process diagrams, state transition diagrams, pseudocodes and the like correspond to various processes that can be represented on a machine-readable physical storage medium and can be executed by a computer or processor, regardless of whether such a computer or processor is explicitly shown or not.

[057] Функции различных элементов, показанных на чертежах, включая любой функциональный блок, обозначенный как «процессор», могут быть реализованы с использованием специализированных аппаратных средств, а также с использованием аппаратных средств, способных выполнять соответствующее программное обеспечение. Если используется процессор, эти функции могут выполняться одним выделенным процессором, одним совместно используемым процессором или множеством отдельных процессоров, некоторые из которых могут использоваться совместно. Кроме того, явное использование термина «процессор» или «контроллер» не должно трактоваться как указание исключительно на аппаратные средства, способные выполнять программное обеспечение, и может подразумевать, помимо прочего, аппаратные средства цифрового сигнального процессора (DSP), сетевой процессор, специализированную интегральную схему (ASIC), программируемую вентильную матрицу (FPGA), постоянное запоминающее устройство (ПЗУ) для хранения программного обеспечения, оперативное запоминающее устройство (ОЗУ) и/или энергонезависимое запоминающее устройство. Также могут подразумеваться другие аппаратные средства, общего назначения и/или заказные. [057] The functions of the various elements shown in the drawings, including any functional unit designated as a "processor", may be implemented using dedicated hardware as well as using hardware capable of executing associated software. If a processor is used, these functions may be performed by a single dedicated processor, a single shared processor, or a plurality of separate processors, some of which may be shared. Furthermore, the explicit use of the term "processor" or "controller" shall not be construed as referring exclusively to hardware capable of executing software, and may include, but are not limited to, a digital signal processor (DSP), a network processor, an application-specific integrated circuit (ASIC), a field-programmable gate array (FPGA), a read-only memory (ROM) for storing software, a random access memory (RAM), and/or a non-volatile memory. Other general-purpose and/or custom hardware may also be included.

[058] Программные модули или просто модули, реализация которых предполагается в виде программных средств, могут быть представлены здесь как любое сочетание элементов блок-схемы или других элементов, указывающих на выполнение шагов процесса и/или содержащих текстовое описание. Такие модули могут выполняться аппаратными средствами, показанными явно или подразумеваемыми.[058] Software modules or simply modules, the implementation of which is intended to be in the form of software, may be represented here as any combination of flow chart elements or other elements indicating the execution of process steps and/or containing a text description. Such modules may be executed by hardware, shown explicitly or implied.

[059] Далее с учетом вышеизложенных принципов рассмотрены некоторые не имеющие ограничительного характера примеры, иллюстрирующие различные варианты реализации аспектов настоящей технологии. [059] Next, taking into account the above principles, some non-limiting examples are considered, illustrating various options for implementing aspects of this technology.

Компьютерная системаComputer system

[060] На фиг. 1 представлена компьютерная система 100, пригодная для использования в некоторых вариантах осуществления настоящей технологии. Компьютерная система 100 содержит различные аппаратные элементы, включая один или несколько одно- или многоядерных процессоров, обобщенно представленных процессором 110, графический процессор 111, твердотельный накопитель 120, ОЗУ 130, интерфейс 140 дисплея и интерфейс 150 ввода-вывода.[060] Fig. 1 shows a computer system 100 suitable for use in some embodiments of the present technology. The computer system 100 includes various hardware elements, including one or more single- or multi-core processors, generally represented by a processor 110, a graphics processor 111, a solid-state drive 120, RAM 130, a display interface 140, and an input/output interface 150.

[061] Связь между различными элементами компьютерной системы 100 может осуществляться через одну или несколько внутренних и/или внешних шин 160, таких как шина PCI, шина USB, шина FireWire стандарта IEEE 1394, шина SCSI, шина Serial-ATA и т.д., с которыми различные аппаратные элементы соединены электронным образом.[061] Communication between the various elements of the computer system 100 may be accomplished via one or more internal and/or external buses 160, such as a PCI bus, a USB bus, an IEEE 1394 FireWire bus, a SCSI bus, a Serial-ATA bus, etc., to which the various hardware elements are electronically connected.

[062] Интерфейс 150 ввода-вывода может соединяться с сенсорным экраном 190 и/или с одной или несколькими внутренними и/или внешними шинами 160. Сенсорный экран 190 может также называться экраном, например, экран (отдельно не обозначен) электронного устройства 210, представленного на фиг. 2. В представленных на фиг. 1 вариантах осуществления изобретения сенсорный экран 190 содержит сенсорные средства 194 (например, чувствительные к нажатию ячейки, встроенные в слой дисплея и позволяющие обнаруживать физическое взаимодействие между пользователем и дисплеем) и контроллер 192 сенсорных средств ввода-вывода, который обеспечивает связь с интерфейсом 140 дисплея и/или с одной или несколькими внутренними и/или внешними шинами 160. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии интерфейс 150 ввода-вывода может соединяться с клавиатурой (не показана), мышью (не показана) или сенсорной площадкой (не показана), которые обеспечивают взаимодействие пользователя с компьютерной системой 100 в дополнение к сенсорному экрану 190 или вместо него. [062] The input/output interface 150 may be connected to a touch screen 190 and/or to one or more internal and/or external buses 160. The touch screen 190 may also be referred to as a screen, such as the screen (not specifically indicated) of the electronic device 210 shown in Fig. 2. In the embodiments shown in Figs. 1 embodiments of the invention, the touch screen 190 includes touch means 194 (for example, pressure-sensitive cells embedded in the display layer and capable of detecting physical interaction between a user and the display) and a touch input/output controller 192 that communicates with the display interface 140 and/or with one or more internal and/or external buses 160. In some non-limiting embodiments of the present technology, the input/output interface 150 may be connected to a keyboard (not shown), a mouse (not shown), or a touch pad (not shown) that enable user interaction with the computer system 100 in addition to or instead of the touch screen 190.

[063] Следует отметить, что в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии некоторые элементы компьютерной системы 100 могут отсутствовать. Например, могут отсутствовать клавиатура и мышь (отдельно не показаны), в частности, если компьютерная система 100 реализована в виде малогабаритного электронного устройства, такого как смартфон (но не ограничиваясь этим). [063] It should be noted that in some non-limiting embodiments of the present technology, some elements of the computer system 100 may be missing. For example, a keyboard and mouse (not shown separately) may be missing, particularly if the computer system 100 is implemented as a small-sized electronic device, such as (but not limited to) a smartphone.

[064] Согласно вариантам осуществления настоящей технологии, твердотельный накопитель 120 хранит программные команды, пригодные для загрузки в ОЗУ 130 и выполнения процессором 110 и/или процессором 111 GPU. Программные команды могут, например, входить в состав библиотеки или приложения.[064] According to embodiments of the present technology, the solid-state drive 120 stores software instructions suitable for loading into the RAM 130 and executing by the processor 110 and/or the GPU processor 111. The software instructions may, for example, be part of a library or an application.

Сетевая вычислительная средаNetwork computing environment

[065] На фиг. 2 представлена схема сетевой вычислительной среды 200, пригодной для использования с некоторыми не имеющими ограничительного характера вариантами осуществления настоящей технологии. Сетевая вычислительная среда 200 содержит электронное устройство 210, соединенное через сеть 240 связи с сервером 250. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии электронное устройство 210 может быть связано с пользователем 220. [065] Fig. 2 is a diagram of a network computing environment 200 suitable for use with some non-limiting embodiments of the present technology. The network computing environment 200 includes an electronic device 210 connected via a communication network 240 to a server 250. In some non-limiting embodiments of the present technology, the electronic device 210 may be associated with a user 220.

[066] В не имеющих ограничительного характера вариантах осуществления настоящей технологии электронное устройство 210 может представлять собой любые компьютерные аппаратные средства, способные выполнять программы, подходящие для решения поставленной задачи. Таким образом, в качестве некоторых не имеющих ограничительного характера примеров электронного устройства 210 можно привести персональные компьютеры (настольные, ноутбуки, нетбуки и т.п.), смартфоны и планшеты. Электронное устройство 210 может содержать некоторые или все элементы компьютерной системы 100, представленной на фиг. 1. [066] In non-limiting embodiments of the present technology, the electronic device 210 may be any computer hardware capable of executing programs suitable for solving the assigned task. Thus, some non-limiting examples of the electronic device 210 may include personal computers (desktops, laptops, netbooks, etc.), smartphones, and tablets. The electronic device 210 may include some or all of the elements of the computer system 100 shown in Fig. 1.

[067] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, на сервере 250 может быть размещена рекомендательная онлайн-платформа 260, которая может быть доступна процессору 110 электронного устройства 210 через сеть 240 связи. В общем случае рекомендательная онлайн-платформа 260 представляет собой веб-ресурс, обеспечивающий пользователю 220 доступ ко множеству 235 цифровых элементов, хранящихся в базе 230 данных, связанной с сервером 250 через соответствующую линию связи. Рекомендательная онлайн-платформа 260 может определять цифровые элементы, которые могут представлять интерес для пользователя 220, а затем передавать указания на такие цифровые элементы электронному устройству 210 для оценивания их пользователем. [067] According to some non-limiting embodiments of the present technology, an online recommendation platform 260 may be hosted on the server 250 and may be accessible to the processor 110 of the electronic device 210 via the communication network 240. In general, the online recommendation platform 260 is a web resource that provides the user 220 with access to a plurality 235 of digital items stored in a database 230 connected to the server 250 via a corresponding communication line. The online recommendation platform 260 may determine digital items that may be of interest to the user 220 and then transmit indications of such digital items to the electronic device 210 for evaluation by the user.

[068] На реализацию рекомендательной онлайн-платформы 260 не накладывается каких-либо ограничений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии рекомендательная онлайн-платформа 260 может быть реализована в виде платформы потокового аудио, такой как платформа потокового аудио Sportify™, платформа потокового аудио Yandex.Music™, платформа потокового аудио YouTube.Music™ и т.д., а множество 235 цифровых элементов, хранящихся в базе 230 данных, может содержать различные фонограммы, такие как песни, подкасты, аудиокниги и т.п. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии рекомендательная онлайн-платформа может быть реализована в виде платформы потокового видео, такой как платформа потокового видео Netflix™, платформа потоковой передачи Amazon™ Prime Video и т.д., а множество 235 цифровых элементов может, например, содержать видеоклипы, фильмы и телевизионные программы. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии рекомендательная онлайн-платформа 260 может быть реализована в виде платформы онлайн-списков, такой как платформа онлайн-списков Yandex.Market™ или платформа онлайн-списков Amazon™, а множество 235 цифровых элементов может содержать рубрицированные списки различных товаров и услуг, доступных для онлайн-покупки. Также возможны и другие варианты реализации рекомендательной онлайн-платформы 260 без выхода за границы настоящей технологии. [068] There are no limitations on the implementation of the online recommendation platform 260. In some non-limiting embodiments of the present technology, the online recommendation platform 260 can be implemented as a streaming audio platform, such as the Sportify™ streaming audio platform, the Yandex.Music™ streaming audio platform, the YouTube.Music™ streaming audio platform, etc., and the plurality 235 digital items stored in the database 230 can contain various audio tracks, such as songs, podcasts, audiobooks, etc. In other non-limiting embodiments of the present technology, the online recommendation platform can be implemented as a streaming video platform, such as the Netflix™ streaming video platform, the Amazon™ Prime Video streaming platform, etc., and the plurality 235 digital items can, for example, contain video clips, movies, and television programs. In other non-limiting embodiments of the present technology, the online recommendation platform 260 may be implemented as an online listing platform, such as the Yandex.Market™ online listing platform or the Amazon™ online listing platform, and the plurality of 235 digital items may contain categorized lists of various goods and services available for online purchase. Other embodiments of the online recommendation platform 260 are also possible without going beyond the boundaries of the present technology.

[069] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может быть реализован в виде традиционного компьютерного сервера и может содержать некоторые или все элементы компьютерной системы 100, представленной на фиг. 1. В одном не имеющем ограничительного характера примере сервер 250 реализован в виде сервера Dell™ PowerEdge™, работающего под управлением операционной системы Microsoft™ Windows Server™, но он также может быть реализован с использованием любых других подходящих аппаратных средств, прикладного программного обеспечения и/или встроенного программного обеспечения либо их сочетания. В представленных не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 представляет собой один сервер. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии (не показаны) функции сервера 250 могут быть распределены между несколькими серверами. [069] In some non-limiting embodiments of the present technology, server 250 may be implemented as a conventional computer server and may include some or all of the elements of computer system 100 shown in Fig. 1. In one non-limiting example, server 250 is implemented as a Dell™ PowerEdge™ server running a Microsoft™ Windows Server™ operating system, but it may also be implemented using any other suitable hardware, application software, and/or firmware, or a combination thereof. In the illustrated non-limiting embodiments of the present technology, server 250 is a single server. In other non-limiting embodiments of the present technology (not shown), the functions of server 250 may be distributed among multiple servers.

[070] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может эксплуатироваться организацией, управляющей рекомендательной онлайн-платформой 260. Например, если рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио Yandex.Music™, то сервер 250 также может эксплуатироваться компанией ООО «Яндекс» (ул. Льва Толстого, 16, Москва, 119021, Россия). В альтернативных не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может эксплуатироваться организацией, отличной от той, что предоставляет рекомендательную онлайн-платформу 260.[070] In some non-limiting embodiments of the present technology, the server 250 may be operated by an organization that operates the online recommendation platform 260. For example, if the online recommendation platform 260 is the Yandex.Music™ streaming audio platform, then the server 250 may also be operated by Yandex LLC (16 Leo Tolstoy St., Moscow, 119021, Russia). In alternative non-limiting embodiments of the present technology, the server 250 may be operated by an organization other than the one that provides the online recommendation platform 260.

[071] Например, с использованием электронного устройства 210 пользователь 220 может осуществлять доступ к рекомендательной онлайн-платформе 260 с электронного устройства 210. Кроме того, пользователь 220 может отправлять запрос 215 рекомендации серверу 250. В ответ сервер 250 может (а) определять набор 225 рекомендуемых цифровых элементов и (б) отправлять указания на набор 225 рекомендуемых цифровых элементов электронному устройству для представления пользователю 220. На способ отправки запроса 215 рекомендации пользователем 220 не накладывается ограничений. [071] For example, using the electronic device 210, the user 220 can access the online recommendation platform 260 from the electronic device 210. In addition, the user 220 can send a recommendation request 215 to the server 250. In response, the server 250 can (a) determine a set 225 of recommended digital items and (b) send indications of the set 225 of recommended digital items to the electronic device for presentation to the user 220. There are no restrictions on the method for sending the recommendation request 215 by the user 220.

Сеть связиCommunication network

[072] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сеть 240 связи представляет собой сеть Интернет. В альтернативных не имеющих ограничительного характера вариантах осуществления настоящей технологии сеть 240 связи может быть реализована в виде любой подходящей локальной сети (LAN, Local Area Network), глобальной сети (WAN, Wide Area Network), частной сети связи и т.п. Должно быть понятно, что варианты осуществления сети связи приведены лишь в иллюстративных целях. Реализация соответствующих линий связи (отдельно не обозначены) между электронным устройством 210 и сервером 250 с одной стороны и сетью 240 связи с другой стороны зависит, среди прочего, от реализации электронного устройства 210 и сервера 250. Лишь в качестве не имеющего ограничительного характера примера, в тех вариантах осуществления настоящей технологии, где электронное устройство 210 реализовано в виде устройства беспроводной связи, такого как смартфон, линия связи может быть реализована в виде беспроводной линии связи. Примеры беспроводных линий связи включают в себя канал сети связи 3G, канал сети связи 4G и т.д. В сети 240 связи также может использоваться беспроводное соединение с сервером 250. [072] In some non-limiting embodiments of the present technology, the communication network 240 is the Internet. In alternative non-limiting embodiments of the present technology, the communication network 240 may be implemented as any suitable local area network (LAN), wide area network (WAN), private communication network, etc. It should be understood that the embodiments of the communication network are given for illustrative purposes only. The implementation of the respective communication links (not separately indicated) between the electronic device 210 and the server 250 on the one hand and the communication network 240 on the other hand depends, among other things, on the implementation of the electronic device 210 and the server 250. Just as a non-limiting example, in those embodiments of the present technology where the electronic device 210 is implemented as a wireless communication device, such as a smartphone, the communication link may be implemented as a wireless communication link. Examples of wireless communication links include a 3G communication network channel, a 4G communication network channel, etc. The communication network 240 may also use a wireless connection to the server 250.

Рекомендательная платформаRecommendation platform

[073] На фиг. 3 представлен графический интерфейс 300 пользователя (GUI) рекомендательной онлайн-платформы 260, отображаемый на электронном устройстве 210, связанном с пользователем 220, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. [073] Fig. 3 illustrates a graphical user interface (GUI) 300 of an online recommendation platform 260 displayed on an electronic device 210 associated with a user 220, according to some non-limiting embodiments of the present technology.

[074] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может инициировать отображение электронным устройством 210 интерфейса 300 GUI в ответ на отправку пользователем 220 запроса на доступ к рекомендательной онлайн-платформе 260, например, путем ввода универсального указателя ресурсов (URL, Universal Resource Locator) сервера 250 в браузерное приложение (отдельно не показано) электронного устройства 210 или путем запуска в нем приложения (отдельно не обозначено на фиг. 3), связанного с рекомендательной онлайн-платформой 260. [074] According to some non-limiting embodiments of the present technology, the server 250 may cause the electronic device 210 to display the GUI interface 300 in response to the user 220 sending a request to access the online recommendation platform 260, such as by entering a universal resource locator (URL) of the server 250 into a browser application (not separately shown) of the electronic device 210 or by launching an application (not separately shown in Fig. 3) associated with the online recommendation platform 260 therein.

[075] Предполагается, что в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии интерфейс 300 GUI может содержать по меньшей мере следующее: (а) указания на по меньшей мере часть набора 225 рекомендуемых цифровых элементов, которая, например, зависит от размеров экрана электронного устройства 210; (б) указание на представляемый в текущий момент времени рекомендуемый цифровой элемент 302; (в) элементы 304 управления, с помощью которых пользователь 220 может управлять представлением рекомендуемого цифрового элемента; и (г) элементы 306 управления обратной связью, с помощью которых пользователь 220 может оставлять свой отклик для рекомендуемого цифрового элемента из набора 225 рекомендуемых цифровых элементов, такого как представляемый в текущий момент времени рекомендуемый цифровой элемент 302. [075] It is contemplated that in some non-limiting embodiments of the present technology, the GUI interface 300 may comprise at least the following: (a) indications of at least a portion of the set 225 of recommended digital items, which, for example, depends on the dimensions of the screen of the electronic device 210; (b) an indication of the currently presented recommended digital item 302; (c) controls 304 by which the user 220 can control the presentation of the recommended digital item; and (d) feedback controls 306 by which the user 220 can leave his/her feedback for a recommended digital item from the set 225 of recommended digital items, such as the currently presented recommended digital item 302.

[076] Несмотря на то, что вариантах осуществления изобретения согласно фиг. 3 интерфейс 300 GUI представляет рекомендательную онлайн-платформу 260, реализованную в виде платформы потокового аудио, должно быть понятно, что в других не имеющих ограничительного характера вариантах осуществления настоящей технологии подобные интерфейсы GUI могут отображаться для рекомендательных онлайн-платформ 260 других видов, некоторые из которых указаны выше.[076] Although in the embodiments of the invention according to Fig. 3 the GUI interface 300 represents an online recommendation platform 260 implemented as a streaming audio platform, it should be understood that in other non-limiting embodiments of the present technology, similar GUI interfaces may be displayed for other types of online recommendation platforms 260, some of which are indicated above.

[077] На способ отправки из электронного устройства 210 запроса 215 рекомендации относительно набора 225 рекомендуемых цифровых элементов не накладывается ограничений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии пользователь 220 может явным образом отправлять запрос 215 рекомендации серверу 250, например, с помощью специального элемента управления интерфейса 300 GUI (такого как «Play Radio» («Включить радио») (не показан на фиг. 3) в примере, где рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио). В других не имеющих ограничительного характера вариантах осуществления настоящей технологии запрос 215 рекомендации может быть инициирован пользователем 220, который обращается к рекомендательной онлайн-платформе 260 с электронного устройства 210, запуская интерфейс 300 GUI. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии запрос 215 рекомендации может быть инициирован пользователем 220, оценивающим цифровой элемент из множества 235 цифровых элементов.[077] There is no limitation on the method for sending a recommendation request 215 from the electronic device 210 regarding the set 225 recommended digital items. In some non-limiting embodiments of the present technology, the user 220 can explicitly send a recommendation request 215 to the server 250, for example, using a special control of the GUI interface 300 (such as "Play Radio" (not shown in Fig. 3) in the example where the online recommendation platform 260 is a streaming audio platform). In other non-limiting embodiments of the present technology, the recommendation request 215 can be initiated by the user 220 accessing the online recommendation platform 260 from the electronic device 210 by launching the GUI interface 300. In other non-limiting embodiments of the present technology, the recommendation request 215 can be initiated by the user 220 rating a digital item from the plurality 235 digital items.

[078] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может формировать набор 225 рекомендуемых цифровых элементов для пользователя 220 по меньшей мере на основе значения популярности элемента каждого цифрового элемента из множества 235 цифровых элементов, как более подробно описано ниже. Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять значение популярности элемента для цифрового элемента из множества 235 цифровых элементов, размещенных на рекомендательной онлайн-платформе 260, на основе пользовательских действий пользователей рекомендательной онлайн-платформы 260, таких как пользователь 220, с этим цифровым элементом. Например, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии такие пользовательские действия могут включать в себя размещение, например, с использованием элементов 306 управления обратной связью, пользовательского отклика под цифровым элементом. [078] In some non-limiting embodiments of the present technology, the server 250 may generate a set 225 of recommended digital items for the user 220 based at least on an item popularity value of each digital item from the plurality 235 digital items, as described in more detail below. According to some non-limiting embodiments of the present technology, the server 250 may determine an item popularity value for a digital item from the plurality 235 digital items posted on the online recommendation platform 260 based on user actions of users of the online recommendation platform 260, such as the user 220, with this digital item. For example, in some non-limiting embodiments of the present technology, such user actions may include posting, for example using the feedback controls 306, a user response under the digital item.

[079] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, интерфейс 300 GUI рекомендательной онлайн-платформы 260 может содержать элементы 306 управления обратной связью, позволяющие указывать пользовательский отклик с помощью двоичных значений, таких как «Like» («Нравится») или «Dislike» («Не нравится»), соответственно, указывающих на положительное или отрицательное пользовательское действие пользователя 220 с цифровым элементом. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии элементы 306 управления обратной связью могут содержать другую конфигурацию, например, индикаторы в виде звезд, указатели эмоций и т.п. (не показаны), обеспечивающую указание пользовательского отклика с использованием одного значения из заранее заданного диапазона значений, например, от 1 до 5 или от 1 до 10, где значение 1 указывает на отрицательное пользовательское действие пользователя 220 с цифровым элементом, а значение 5 или 10, соответственно, указывает на положительное пользовательское действие пользователя 220 с цифровым элементом.[079] According to some non-limiting embodiments of the present technology, the GUI interface 300 of the online recommendation platform 260 may comprise feedback controls 306 that allow a user response to be indicated using binary values, such as "Like" or "Dislike", respectively, indicating a positive or negative user action of the user 220 with the digital item. In other non-limiting embodiments of the present technology, the feedback controls 306 may comprise another configuration, such as star indicators, emotion indicators, and the like (not shown), that allow a user response to be indicated using one value from a predetermined range of values, such as from 1 to 5 or from 1 to 10, where the value 1 indicates a negative user action of the user 220 with the digital item, and the value 5 or 10, respectively, indicates a positive user action of the user 220 with the digital item.

[080] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значение популярности элемента на основе других пользовательских действий пользователя 220 с цифровым элементом, которые, подобно пользовательскому отклику, также могут указывать на положительное или отрицательное пользовательское действие с цифровым элементом. Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, такие другие пользовательские действия пользователя 220, указывающие на положительное пользовательское действие с цифровым элементом, могут включать в себя: (а) выбор цифрового элемента для оценивания; (б) поиск цифрового элемента на рекомендательной онлайн-платформе 260; (в) использование функции «поделиться» для цифрового элемента через учетные записи пользователя 220 в социальных сетях; (г) включение повтора представления цифрового элемента; (д) добавление цифрового элемента в список избранных цифровых элементов пользователя 220 и т.п. [080] In some non-limiting embodiments of the present technology, the server 250 may determine the popularity value of the item based on other user actions of the user 220 with the digital item, which, like the user response, may also indicate a positive or negative user action with the digital item. According to some non-limiting embodiments of the present technology, such other user actions of the user 220 indicating a positive user action with the digital item may include: (a) selecting the digital item for rating; (b) searching for the digital item on the online recommendation platform 260; (c) using the "share" function for the digital item through the user 220 social networking accounts; (d) enabling a repeat presentation of the digital item; (e) adding the digital item to the user 220's list of favorite digital items, etc.

[081] Пользовательские действия пользователя 220, указывающие на отрицательное пользовательское действие с цифровым элементом из множества 235 цифровых элементов, могут, среди прочего, включать в себя: (а) пропуск части цифрового элемента; (б) пропуск всего цифрового элемента и переход к следующему цифровому элементу; (в) прерывание представления цифрового элемента с последующим поиском другого цифрового элемента для оценивания и т.п. Также возможны другие пользовательские действия пользователя 220, указывающие на положительное и отрицательное пользовательское действие с цифровым элементом, без выхода за границы настоящей технологии.[081] User actions of the user 220 indicating a negative user action with a digital element from the plurality 235 of digital elements may include, among other things: (a) skipping a portion of the digital element; (b) skipping the entire digital element and moving on to the next digital element; (c) interrupting the presentation of the digital element and then searching for another digital element for evaluation, etc. Other user actions of the user 220 indicating a positive and negative user action with a digital element are also possible, without going beyond the scope of the present technology.

[082] Таким образом, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, в ответ на получение запроса 215 рекомендации от электронного устройства 210 сервер 250 на основе по меньшей мере указаний на пользовательские отклики может (а) определять значение популярности элемента для каждого элемента из множества 235 цифровых элементов и (б) определять на основе значений популярности элементов из множества 235 цифровых элементов набор 225 рекомендуемых цифровых элементов для предоставления пользователю 220, как это описано выше. Например, рекомендуемый цифровой элемент из набора 225 рекомендуемых цифровых элементов может представлять собой один из наиболее популярных цифровых элементов из множества 235 цифровых элементов. В другом примере сервер 250 может определять в качестве рекомендуемого цифрового элемента цифровой элемент, предоставленный поставщиком элементов, связанным с по меньшей мере одним из наиболее популярных цифровых элементов. В другом примере сервер 250 может определять в качестве рекомендуемого цифрового элемента для пользователя 220 цифровой элемент, наиболее популярный среди пользователей, схожих с пользователем 220, исходя из заранее заданных пользовательских признаков. [082] Thus, according to some non-limiting embodiments of the present technology, in response to receiving a recommendation request 215 from the electronic device 210, the server 250, based on at least indications of user responses, may (a) determine an item popularity value for each item from the plurality 235 digital items and (b), based on the popularity values of the items from the plurality 235 digital items, determine a set 225 recommended digital items for provision to the user 220, as described above. For example, a recommended digital item from the set 225 recommended digital items may be one of the most popular digital items from the plurality 235 digital items. In another example, the server 250 may determine as a recommended digital item a digital item provided by an item provider associated with at least one of the most popular digital items. In another example, the server 250 may determine as a recommended digital item for the user 220 a digital item that is most popular among users similar to the user 220, based on predetermined user features.

[083] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять набор 225 рекомендуемых цифровых элементов так, чтобы максимизировать значение вероятности положительного пользовательского действия пользователя 220 с каждым элементом из набора 225 рекомендуемых цифровых элементов, на которое указывает, например, положительный пользовательский отклик. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять набор 225 рекомендуемых цифровых элементов так, чтобы минимизировать значение вероятности отрицательного пользовательского действия пользователя 220 с каждым элементом из набора 225 рекомендуемых цифровых элементов, на которое указывает, например, отрицательный пользовательский отклик.[083] In some non-limiting embodiments of the present technology, the server 250 may determine the set 225 of recommended digital items so as to maximize a probability value of a positive user action of the user 220 with each element of the set 225 of recommended digital items, as indicated by, for example, a positive user response. In other non-limiting embodiments of the present technology, the server 250 may determine the set 225 of recommended digital items so as to minimize a probability value of a negative user action of the user 220 with each element of the set 225 of recommended digital items, as indicated by, for example, a negative user response.

[084] В частности, с этой целью в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять для набора 225 рекомендуемых цифровых элементов рекомендуемые цифровые элементы с признаками элемента, подобными признакам тех цифровых элементов, с которыми пользователь 220 совершал наиболее положительные пользовательские действия, как это описано выше. В другом примере сервер 250 может определять для включения в набор 225 рекомендуемых цифровых элементов рекомендуемые цифровые элементы из числа элементов с положительными пользовательскими действиями со стороны других пользователей рекомендательной онлайн-платформы 260 с пользовательскими признаками, схожими с признаками пользователя 220.[084] In particular, for this purpose, in some non-limiting embodiments of the present technology, the server 250 may determine for the set 225 of recommended digital items recommended digital items with element features similar to the features of those digital items with which the user 220 has performed the most positive user actions, as described above. In another example, the server 250 may determine for inclusion in the set 225 of recommended digital items recommended digital items from among the items with positive user actions by other users of the online recommendation platform 260 with user features similar to the features of the user 220.

[085] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, признаки элемента, связанные с цифровым элементом, могут указывать на его собственные параметры, которые предположительно могут зависеть от характера цифрового элемента. Например, в тех вариантах осуществления изобретения, где рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио, а цифровой элемент представляет собой фонограмму, признаки элемента, могут, среди прочего, включать в себя: (а) жанр фонограммы; (б) заранее заданное настроение, вызываемое фонограммой; (в) период популярности, связанный с фонограммой, например, шестидесятые годы, семидесятые годы, девяностые годы и т.п.; (г) поставщика фонограммы, например, исполнителя, продюсера, звукозаписывающую студию и т.п.; (д) продолжительность фонограммы; (е) дату выпуска фонограммы; (ж) ритм фонограммы; (з) альбом фонограммы и т.п. [085] According to some non-limiting embodiments of the present technology, the element features associated with the digital element may indicate its own parameters, which may conceivably depend on the nature of the digital element. For example, in those embodiments of the invention where the online recommendation platform 260 is an audio streaming platform and the digital element is a phonogram, the element features may, among other things, include: (a) the genre of the phonogram; (b) a predetermined mood evoked by the phonogram; (c) a popular period associated with the phonogram, such as the sixties, seventies, nineties, etc.; (d) a provider of the phonogram, such as an artist, producer, recording studio, etc.; (e) the length of the phonogram; (f) the release date of the phonogram; (g) the rhythm of the phonogram; (h) the album of the phonogram, etc.

[086] Пользовательские признаки пользователя рекомендательной онлайн-платформы 260, такого как пользователь 220, могут, среди прочего, включать в себя: (а) социально-демографические характеристики пользователя 220, включая возраст пользователя 220, пол пользователя 220, статус занятости пользователя 220, средний доход пользователя 220 и т.п.; (б) данные, указывающие на историю поиска пользователя 220; (в) данные, указывающие на историю просмотра веб-страниц пользователя 220 и т.п. [086] User characteristics of a user of the online recommendation platform 260, such as a user 220, may include, among other things: (a) socio-demographic characteristics of the user 220, including the age of the user 220, the gender of the user 220, the employment status of the user 220, the average income of the user 220, etc.; (b) data indicating the search history of the user 220; (c) data indicating the web browsing history of the user 220, etc.

[087] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии для определения набора 225 рекомендуемых цифровых элементов для пользователя 220, как это описано выше, сервер 250 может выполнять алгоритм 280 MLA, обученный определению рекомендуемых цифровых элементов на основе вышеупомянутых признаков для каждого пользователя рекомендательной онлайн-платформы 260. В частности, выполняемый алгоритм 280 MLA может быть обучен определению значений вероятности положительного действия пользователя 220 с каждым элементом из множества 235 цифровых элементов, такого как формирование для него пользователем 220 положительного пользовательского отклика. Кроме того, сервер 250 может (а) ранжировать цифровые элементы согласно соответствующим значениям вероятности и (б) выбирать N цифровых элементов с наибольшим рангом, например, 100, 500 или 1000, для включения в набор 225 рекомендуемых цифровых элементов. [087] In some non-limiting embodiments of the present technology, to determine the set 225 of recommended digital items for the user 220, as described above, the server 250 may execute the MLA algorithm 280 trained to determine the recommended digital items based on the above-mentioned features for each user of the online recommendation platform 260. In particular, the executed MLA algorithm 280 may be trained to determine the probability values of a positive action by the user 220 with each item from the plurality 235 of digital items, such as the user 220 generating a positive user response for it. In addition, the server 250 may (a) rank the digital items according to the corresponding probability values and (b) select N digital items with the highest rank, such as 100, 500 or 1000, for inclusion in the set 225 of recommended digital items.

[088] Как более подробно описано ниже, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может обучать алгоритм 280 MLA на основе обучающего набора данных, содержащего множество обучающих цифровых объектов, каждый из которых может, среди прочего, содержать: (а) указание на цифровой элемент из множества 235 цифровых элементов; (б) признаки элемента для цифрового элемента; (в) указания на прошлые пользовательские действия пользователей рекомендательной онлайн-платформы 260 с цифровым элементом, такие как пользовательский отклик, предоставленный для текущего цифрового элемента, как это описано выше; (г) пользовательские признаки пользователей, взаимодействовавших с цифровым элементом, например, оставивших под ним свои пользовательские отклики. [088] As described in more detail below, according to some non-limiting embodiments of the present technology, the server 250 may train the MLA algorithm 280 based on a training data set comprising a plurality of training digital objects, each of which may comprise, among other things: (a) an indication of a digital item from the plurality 235 digital items; (b) item features for the digital item; (c) indications of past user actions of users of the online recommendation platform 260 with the digital item, such as a user response provided for the current digital item, as described above; (d) user features of users who have interacted with the digital item, such as by leaving their user responses under it.

[089] Таким образом, путем определения и предоставления рекомендуемых цифровых элементов пользователям рекомендательной онлайн-платформы 260, сервер 250 может: (а) представлять различные цифровые элементы пользователям; (б) получать их пользовательские отклики для рекомендуемых цифровых элементов; (в) повышать точность последующих рекомендаций на основе пользовательских откликов. Предполагается, что благодаря такому предоставлению рекомендуемых элементов может быть повышена удовлетворенность (а) пользователей за счет предоставления им представляющих для них интерес цифровых элементов и (б) поставщиков элементов вследствие более полного представления их различных цифровых элементов пользователям рекомендательной онлайн-платформы 260. [089] Thus, by determining and providing recommended digital items to users of the online recommendation platform 260, the server 250 can: (a) present various digital items to the users; (b) receive their user responses for the recommended digital items; (c) improve the accuracy of subsequent recommendations based on the user responses. It is believed that by providing such recommended items, the satisfaction of (a) the users can be improved by providing them with digital items of interest to them and (b) the item providers by more fully presenting their various digital items to users of the online recommendation platform 260.

[090] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, множество 235 цифровых элементов, размещенных на рекомендательной онлайн-платформе 260, может содержать (а) старую часть 255 цифровых элементов, загруженных на рекомендательную онлайн-платформу 260 множеством 245 поставщиков старых элементов с помощью их электронных устройств (отдельно не обозначены), и (б) новую часть 275 цифровых элементов, загруженных на рекомендательную онлайн-платформу 260 множеством 265 поставщиков новых элементов с помощью их электронных устройств (отдельно не обозначены). [090] According to some non-limiting embodiments of the present technology, the plurality 235 of digital items posted on the online recommendation platform 260 may comprise (a) an old portion 255 of digital items uploaded to the online recommendation platform 260 by a plurality 245 of old item providers using their electronic devices (not separately indicated), and (b) a new portion 275 of digital items uploaded to the online recommendation platform 260 by a plurality 265 of new item providers using their electronic devices (not separately indicated).

[091] В контексте настоящего описания термин «поставщик элементов» в целом означает некое лицо, например, частное лицо, музыканта или музыкального продюсера, или организацию, например, студию музыкальной звукозаписи, имеющее множество цифровых элементов, загруженных на рекомендательную онлайн-платформу 260 для совместного доступа к ним пользователей. [091] In the context of the present description, the term "item provider" generally means a person, such as an individual, musician or music producer, or an organization, such as a music recording studio, that has a plurality of digital items uploaded to the online recommendation platform 260 for shared access by users.

[092] Кроме того, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, старый цифровой элемент из старой части 255 цифровых элементов означает цифровой элемент, который был доступен на рекомендательной онлайн-платформе 260 дольше, чем заранее заданное пороговое значение периода доступности, например, такое как одна неделя, один месяц или один год. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии старые цифровые элементы могут представлять собой цифровые элементы, получившие по меньшей мере одно указание на пользовательский отклик по меньшей мере одного пользователя рекомендательной онлайн-платформы 260. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии старый цифровой элемент может представлять собой цифровой элемент, предоставленный поставщиком из множества 245 поставщиков старых элементов, который присутствует на рекомендательной онлайн-платформе 260 дольше, чем заранее заданное пороговое значение времени присутствия, которое, например, может соответствовать месяцу, кварталу или году. Таким образом, в по меньшей мере некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии по меньшей мере некоторые элементы из множества 257 старых цифровых элементов, загруженных на рекомендательную онлайн-платформу 260 поставщиком 247 старых элементов, получили по меньшей мере одно указание на пользовательский отклик от по меньшей мере одного пользователя. [092] In addition, according to some non-limiting embodiments of the present technology, an old digital item from the old portion 255 of digital items means a digital item that has been available on the online recommendation platform 260 for longer than a predetermined threshold of availability period, such as, for example, one week, one month, or one year. In other non-limiting embodiments of the present technology, old digital items may be digital items that have received at least one indication of a user response from at least one user of the online recommendation platform 260. In other non-limiting embodiments of the present technology, an old digital item may be a digital item provided by a provider from the plurality 245 of old item providers that is present on the online recommendation platform 260 for longer than a predetermined threshold of presence time, which may correspond to, for example, a month, a quarter, or a year. Thus, in at least some non-limiting embodiments of the present technology, at least some items from the plurality 257 legacy digital items uploaded to the online recommendation platform 260 by the provider 247 legacy items have received at least one indication of a user response from at least one user.

[093] В контексте настоящего описания, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, новый цифровой элемент из новой части 275 цифровых элементов представляет собой цифровой элемент, который не имеет указаний на пользовательские действия с ним, включая пользовательский отклик, например, потому, что (а) был доступен на рекомендательной онлайн-платформе 260 меньше заранее заданного порогового значения периода доступности или (б) был загружен поставщиком из множества 265 поставщиков новых элементов, который неизвестен пользователям рекомендательной онлайн-платформы 260 (непопулярен). Например, множество 277 новых цифровых элементов поставщика 267 новых элементов может стать доступным на рекомендательной онлайн-платформе 260 в результате расширения области обслуживания рекомендательной онлайн-платформы 260 на новую географическую территорию, поставщики элементов с которой ранее не присутствовали на рекомендательной онлайн-платформе 260. [093] In the context of the present description, according to some non-limiting embodiments of the present technology, a new digital item from the new portion 275 of digital items is a digital item that has no indication of user actions with it, including a user response, for example, because (a) it was available on the online recommendation platform 260 for less than a predetermined threshold value of the availability period or (b) it was uploaded by a provider from the plurality 265 providers of new items that is unknown to users of the online recommendation platform 260 (unpopular). For example, the plurality 277 of new digital items of the provider 267 of new items may become available on the online recommendation platform 260 as a result of expanding the service area of the online recommendation platform 260 to a new geographic area, the providers of items from which were not previously present on the online recommendation platform 260.

[094] Поскольку каждый элемент из множества 277 новых цифровых элементов не имеет пользовательского отклика или имеет лишь очень ограниченный пользовательский отклик, сервер 250 впоследствии может оказаться неспособным определять значения популярности элементов для каждого элемента из множества 277 новых цифровых элементов, а алгоритм 280 MLA, обученный определению рекомендуемых цифровых элементов на основе, среди прочего, значений популярности элементов из множества 235 цифровых элементов, может игнорировать множество 277 новых цифровых элементов поставщика 267 новых элементов. Таким образом, элементы из множества 277 новых цифровых элементов могут оказаться не включенными в набор 225 рекомендуемых цифровых элементов. [094] Since each item from the set 277 new digital items has no user response or only a very limited user response, the server 250 may subsequently be unable to determine item popularity values for each item from the set 277 new digital items, and the MLA algorithm 280, trained to determine recommended digital items based on, among other things, the popularity values of items from the set 235 digital items, may ignore the set 277 new digital items of the provider 267 new items. Thus, items from the set 277 new digital items may not be included in the set 225 recommended digital items.

[095] Соответственно, такая «пессимизация» множества 277 цифровых элементов при составлении набора 225 рекомендуемых цифровых элементов может привести к тому, что пользователь 220 не обнаружит релевантных рекомендуемых цифровых элементов и, следовательно, новый поставщик 267 элементов потеряет свою целевую аудиторию. [095] Accordingly, such a “pessimization” of the set 277 digital elements when compiling the set 225 recommended digital elements may result in the user 220 not finding relevant recommended digital elements and, consequently, the new supplier 267 elements will lose its target audience.

[096] Один из простейших подходов к решению этой проблемы разреженности данных заключается в получении значений популярности элементов для каждого нового цифрового элемента из новой части 275 цифровых элементов на основе корреляции между его признаками элемента и признаками элемента каждого старого цифрового элемента из старой части 255 цифровых элементов. Тем не менее, вследствие потенциально большого количества различных признаков элементов и количества самих цифровых элементов такой анализ может представлять собой задачу, требующего очень больших затрат ресурсов процессора 110 сервера 250. [096] One of the simplest approaches to solving this data sparseness problem is to obtain item popularity values for each new digital item from the new portion 275 of digital items based on the correlation between its item features and the item features of each old digital item from the old portion 255 of digital items. However, due to the potentially large number of different item features and the number of digital items themselves, such an analysis can be a very resource-intensive task for the processor 110 of the server 250.

[097] Разработчики настоящей технологии установили, что указание на пользовательский отклик может быть определено непосредственно для каждого нового цифрового элемента из новой части 275 цифровых элементов на основе указаний на пользовательские отклики, распределенные в старой части 255 цифровых элементов. В частности, настоящие способы и системы предназначены для назначения цифровым элементам из новой части 275 цифровых элементов указаний на синтезированный пользовательский отклик, который, в отличие от фактического пользовательского отклика, не был предоставлен пользователями рекомендательной онлайн-платформы 260, а был определен сервером 250. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии настоящие способы включают в себя обучение алгоритма определению значений вероятности предоставления пользователями рекомендательной онлайн-платформы 260 указаний на пользовательские отклики (как положительные, так и отрицательные) для цифровых элементов из новой части 275 цифровых элементов на основе распределения указаний на пользовательские отклики в старой части 255 цифровых элементов. [097] The developers of the present technology have found that an indication of a user response can be determined directly for each new digital item from the new portion 275 of digital items based on indications of user responses distributed in the old portion 255 of digital items. In particular, the present methods and systems are intended to assign indications of a synthesized user response to the digital items from the new portion 275 of digital items, which, unlike the actual user response, was not provided by users of the online recommendation platform 260, but was determined by the server 250. In some non-limiting embodiments of the present technology, the present methods include training an algorithm to determine the values of the probability of providing indications of user responses (both positive and negative) by users of the online recommendation platform 260 for the digital items from the new portion 275 of digital items based on the distribution of indications of user responses in the old portion 255 of digital items.

[098] Новые цифровые элементы из новой части 275 цифровых элементов, получившие указания на синтезированные пользовательские отклики, могут рассматриваться алгоритмом 280 MLA в процессе определения рекомендуемых цифровых элементов для пользователя 220, что обеспечивает возможность представления новых цифровых элементов пользователям рекомендательной онлайн-платформы 260. Соответственно, как описано выше, в результате возможна взаимная польза для пользователей и для множества 265 поставщиков новых элементов рекомендательной онлайн-платформы 260, поскольку первые могут обнаруживать новые представляющие для них интерес релевантные цифровые элементы, а последние могут расширять свою целевую аудиторию. [098] New digital items from the new portion 275 of digital items that have received indications of the synthesized user responses may be considered by the MLA algorithm 280 in the process of determining recommended digital items for the user 220, which allows for the new digital items to be presented to the users of the online recommendation platform 260. Accordingly, as described above, the result may be a mutual benefit for the users and for the plurality 265 providers of new items of the online recommendation platform 260, since the former may discover new relevant digital items of interest to them, and the latter may expand their target audience.

[099] Ниже со ссылкой на фиг. 4-6 подробно описан возможный анализ распределения указаний на пользовательские отклики в старой части 255 цифровых элементов с целью определения указаний на синтезированные отклики для новых цифровых элементов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.[099] Below, with reference to Figs. 4-6, a possible analysis of the distribution of user response indications in the old portion 255 of digital elements is described in detail for the purpose of determining synthetic response indications for new digital elements according to some non-limiting embodiments of the present technology.

Оценивающая модель MLML Estimation Model

[0100] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, для определения указаний на синтезированные пользовательские отклики для каждого нового цифрового элемента из новой части 275 цифровых элементов, как это описано выше, сервер 250 сначала может на основе указаний на пользовательские отклики, полученные для некоторых элементов из старой части 255 цифровых элементов, обучать оценивающую модель ML определению прогнозируемых указаний на пользовательские отклики для цифровых элементов, таких как элементы из старой части 255 цифровых элементов, не имеющие указаний на пользовательские отклики. На реализацию оценивающей модели ML не накладывается ограничений. Тем не менее, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии оценивающая модель ML может быть реализована в виде модели ML матричной факторизации. [0100] According to some non-limiting embodiments of the present technology, in order to determine the indications of the synthesized user responses for each new digital item from the new portion 275 of digital items, as described above, the server 250 may first, based on the indications of the user responses received for some items from the old portion 255 of digital items, train an ML scoring model to determine the predicted indications of the user responses for digital items, such as items from the old portion 255 of digital items that do not have indications of the user responses. There are no limitations on the implementation of the ML scoring model. However, in some non-limiting embodiments of the present technology, the ML scoring model may be implemented as a matrix factorization ML model.

[0101] На фиг. 4A и 4Б представлены схематические изображения входной матрицы 402 и выходной матрицы 404 модели ML матричной факторизации согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. [0101] Figs. 4A and 4B are schematic diagrams of an input matrix 402 and an output matrix 404 of an ML matrix factorization model according to some non-limiting embodiments of the present technology.

[0102] Предполагается, что входная матрица 402 имеет размер m*n, где m - количество пользователей рекомендательной онлайн-платформы 260, n - количество старых цифровых элементов в старой части 255 цифровых элементов. Таким образом, элемент входной матрицы 402 содержит: (а) фактическое указание 406 на пользовательский отклик, например, «Like» («Нравится») или «Dislike» («Не нравится»), как это описано выше, предоставленный пользователем, таким как пользователь 220, для старого цифрового элемента из старой части 255 цифровых элементов; (б) признаки элемента для старого цифрового элемента; и (в) пользовательские признаки пользователя 220, сформировавшего фактическое указание 406 под старым цифровым элементом. [0102] It is assumed that the input matrix 402 has a size of m*n , where m is the number of users of the online recommendation platform 260, n is the number of old digital items in the old part 255 of digital items. Thus, an element of the input matrix 402 contains: (a) an actual indication 406 of a user response, for example, “Like” or “Dislike” as described above, provided by a user, such as user 220, for an old digital item from the old part 255 of digital items; (b) item features for the old digital item; and (c) user features of user 220 who formed the actual indication 406 under the old digital item.

[0103] В общем случае модель матричной факторизации представляет собой модель ML векторных представлений, которая может быть обучена, например, сервером 250, определению матрицы P векторных представлений пользователей (например, пользователей рекомендательной онлайн-платформы 260) и матрицы Q векторных представлений элементов (например, элементов из старой части 255 цифровых элементов) таких, что выходная матрица 404, определенная как PQ T , аппроксимирует входную матрицу 402 с требуемым уровнем достоверности. В частности, строка матрицы Q векторных представлений элементов содержит латентные признаки элемента для элемента из старой части 255 цифровых элементов, представляющие его фактические признаки элемента, а строка матрицы P векторных представлений пользователей содержит латентные признаки пользователя, например, пользователя 220, которые указывают на степень заинтересованности пользователя 220 в элементе с такими фактическими признаками элемента из старой части 255 цифровых элементов. [0103] In general, the matrix factorization model is an ML model of vector representations that can be trained, for example, by the server 250, to determine a matrix P of vector representations of users (for example, users of the online recommendation platform 260) and a matrix Q of vector representations of items (for example, items from the old part 255 of digital items) such that the output matrix 404, defined as PQ T , approximates the input matrix 402 with a desired level of confidence. In particular, a row of the matrix Q of vector representations of items contains latent features of an item for an item from the old part 255 of digital items, representing its actual features of the item, and a row of the matrix P of vector representations of users contains latent features of a user, for example, user 220, which indicate the degree of interest of user 220 in an item with such actual features of an item from the old part 255 of digital items.

[0104] В этой связи сервер 250 может (а) формировать целевую функцию (также известную в данной области техники как функция потерь), указывающую на различия между соответствующими элементами входной и выходной матриц 402, 404, и (б) путем минимизации целевой функции определять элементы матриц P и Q векторных представлений пользователей и элементов. Например, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии целевая функция может представлять собой целевую функцию среднеквадратичной ошибки, которая может быть представлена следующим уравнением: [0104] In this regard, the server 250 may (a) generate an objective function (also known in the art as a loss function) indicating the differences between the corresponding elements of the input and output matrices 402, 404, and (b) by minimizing the objective function, determine the elements of the matrices P and Q of the vector representations of the users and elements. For example, in some non-limiting embodiments of the present technology, the objective function may be a mean square error objective function, which may be represented by the following equation:

где - элемент входной матрицы 402, - соответствующий элемент выходной матрицы 404, - соответствующий элемент матрицы P векторных представлений пользователей, - соответствующий элемент матрицы Q векторных представлений элементов.Where - input matrix element 402, - the corresponding element of the output matrix 404, - the corresponding element of the matrix P of vector representations of users, - the corresponding element of the matrix Q of vector representations of the elements.

[0105] Следовательно, путем минимизации целевой функции, например, с использованием способа градиентного спуска, сервер 250 может определять элементы матрицы P векторных представлений пользователей и матрицы Q векторных представлений элементов. На основе определенных таким образом матриц P и Q векторных представлений пользователей и векторных представлений элементов сервер 250 может определять элементы выходной матрицы 404, схематически представленной на фиг. 4Б. Как показано в выходной матрице 404, на основе сходства признаков элемента и пользователя, связанных с элементами из старой части 255 цифровых элементов, имеющими фактические указания на пользовательские отклики, обученная таким образом модель ML матричной факторизации способна: (а) определять для элемента из старой части 255 цифровых элементов, который ранее не имел указания на пользовательский отклик, прогнозируемое указание 408 на пользовательский отклик; и (б) аппроксимировать имеющиеся фактические указания на пользовательские отклики для элементов из старой части 255 цифровых элементов, которые их имели, например, для старого цифрового элемента, связанного с фактическим указанием 406 на пользовательский отклик. [0105] Therefore, by minimizing the objective function, for example using the gradient descent method, the server 250 can determine the elements of the matrix P of vector representations of users and the matrix Q of vector representations of items. Based on the thus determined matrices P and Q of vector representations of users and vector representations of items, the server 250 can determine the elements of the output matrix 404, schematically represented in Fig. 4B. As shown in the output matrix 404, based on the similarity of the features of the item and the user associated with the items from the old portion 255 of digital items that have actual indications of user responses, the matrix factorization ML model trained in this way is capable of: (a) determining, for an item from the old portion 255 of digital items that previously did not have an indication of a user response, a predicted indication 408 of a user response; and (b) approximate the existing actual user response indications for the elements from the old portion 255 of digital elements that had them, such as for the old digital element associated with the actual user response indication 406.

[0106] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии для определения указаний на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов сервер 250 может (а) увеличивать размер входной матрицы 402 путем добавления в нее столбцов, указывающих на элементы из новой части 275 цифровых элементов; (б) повторно определять матрицы P и Q векторных представлений пользователей и векторных представлений элементов; и (в) формировать обновленную версию выходной матрицы 404, которая, таким образом, содержит указания на синтезированные пользовательские отклики, которые представляют собой прогнозируемые указания на пользовательские отклики для каждого элемента из новой части 275 цифровых элементов. [0106] In addition, in some non-limiting embodiments of the present technology, to determine the indications of a synthesized user response for each element of the new portion 275 of digital elements, the server 250 may (a) increase the size of the input matrix 402 by adding columns thereto indicating elements of the new portion 275 of digital elements; (b) re-determine the matrices P and Q of the vector representations of users and the vector representations of elements; and (c) generate an updated version of the output matrix 404, which thus contains indications of synthesized user responses that are predicted indications of user responses for each element of the new portion 275 of digital elements.

[0107] Должно быть понятно, что помимо описанной выше модели матричной факторизации, для реализации оценивающей модели ML могут использоваться и другие архитектуры ML, включая, среди прочего, модель ML на основе деревьев решений, модель ML на основе нейронной сети и т.д. [0107] It should be understood that in addition to the matrix factorization model described above, other ML architectures may be used to implement the ML evaluation model, including, among others, a decision tree-based ML model, a neural network-based ML model, etc.

[0108] При этом, как описано выше, определение связей между пользовательскими признаками и признаками элемента для каждого элемента из новой части 275 цифровых элементов путем повторного обучения модели ML может представлять собой задачу для сервера 250, требующую значительных ресурсов. Кроме того, признаки элемента для некоторых элементов из новой части 275 цифровых элементов могут быть недоступными. [0108] In this case, as described above, determining the relationships between the user features and the feature of the item for each item from the new portion 275 of digital items by retraining the ML model may be a task for the server 250 that requires significant resources. In addition, the feature of the item for some items from the new portion 275 of digital items may be unavailable.

[0109] В этой связи в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может с использованием прогнозов оценивающей модели ML обучать алгоритм формирования синтезированных пользовательских откликов, способный формировать указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов на основе разреженных входных данных, например, без учета признаков элемента из новой части 275 цифровых элементов. В частности, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, алгоритм формирования синтезированных пользовательских откликов может определять указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов так, чтобы они распределялись в новой части 275 цифровых элементов согласно распределению откликов для прогнозируемых указаний на отклики в старой части 255 цифровых элементов. Иными словами, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов с использованием распределения откликов прогнозируемых указаний на отклики в старой части 255 цифровых элементов в качестве фактических данных. [0109] In this regard, in some non-limiting embodiments of the present technology, the server 250 may, using the predictions of the ML scoring model, train an algorithm for generating synthesized user responses that is capable of generating an indication of a synthesized user response for each item from the new portion 275 of digital items based on sparse input data, for example, without taking into account the features of an item from the new portion 275 of digital items. In particular, according to some non-limiting embodiments of the present technology, the algorithm for generating synthesized user responses may determine an indication of a synthesized user response for each item from the new portion 275 of digital items such that they are distributed in the new portion 275 of digital items according to a distribution of responses for predicted indications of responses in the old portion 255 of digital items. In other words, the server 250 may train the algorithm for generating synthesized user responses using the distribution of responses of the predicted indications of responses in the old portion 255 of digital items as actual data.

[0110] В общем случае распределение откликов представляет распределение прогнозируемых указаний на положительные и отрицательные пользовательские отклики в старой части 255 цифровых элементов. Тем не менее должно быть понятно, что в других не имеющих ограничительного характера вариантах осуществления настоящей технологии в распределении откликов могут учитываться только фактические указания на пользовательские отклики, предоставленные для некоторых элементов из старой части 255 цифровых элементов пользователями рекомендательной онлайн-платформы 260. [0110] In general, the distribution of responses represents the distribution of predicted indications of positive and negative user responses in the old portion 255 of digital items. However, it should be understood that in other non-limiting embodiments of the present technology, the distribution of responses may take into account only actual indications of user responses provided for some items from the old portion 255 of digital items by users of the online recommendation platform 260.

[0111] Таким образом, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять распределение откликов путем определения его конкретных параметров, например, в числе прочего, по меньшей мере одного из следующих: математическое ожидание, среднеквадратическое отклонение, коэффициент асимметрии и крутизна распределения откликов. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять распределение откликов с использованием его графического представления. [0111] Thus, in some non-limiting embodiments of the present technology, the server 250 may determine the response distribution by determining specific parameters thereof, such as, but not limited to, at least one of the following: mathematical expectation, standard deviation, skewness coefficient, and slope of the response distribution. In other non-limiting embodiments of the present technology, the server 250 may determine the response distribution using a graphical representation thereof.

[0112] В результате могут быть уменьшены затраты вычислительных ресурсов на сервере 250 для определения указаний на синтезированные пользовательские отклики и новые цифровые элементы могут быть более эффективно представлены пользователям рекомендательной онлайн-платформы 260. [0112] As a result, the computational resources required on the server 250 to determine the indications of the synthesized user responses can be reduced and new digital elements can be more efficiently presented to users of the online recommendation platform 260.

[0113] Ниже описано, как сервер 250 может обучать алгоритм формирования синтезированного отклика с учетом распределения откликов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. [0113] The following describes how the server 250 may train an algorithm for generating a synthesized response given a distribution of responses according to some non-limiting embodiments of the present technology.

Алгоритм формирования синтезированных пользовательских откликов. Этап обученияAlgorithm for generating synthesized user responses. Training stage

[0114] Согласно некоторым не имеющим ограничительного характера вариантах осуществления настоящей технологии, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов определению указаний на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов на основе старой части 255 цифровых элементов. [0114] According to some non-limiting embodiments of the present technology, the server 250 may train the synthesized user response generation algorithm to determine the synthesized user response indications for each element of the new portion 275 of digital elements based on the old portion 255 of digital elements.

[0115] В частности, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов так, чтобы с учетом конкретного подхода к выбору старых цифровых элементов из старой части 255 цифровых элементов алгоритм формирования синтезированных пользовательских откликов был способен: (а) определять для старого цифрового элемента, такого как элемент из множества 257 старых цифровых элементов, связанного со поставщиком 247 старых элементов, значение вероятности получения старым цифровым элементом, например, положительного пользовательского отклика; и (б) назначать на основе этого значения вероятности указание на синтезированный пользовательский отклик для старого цифрового элемента так, чтобы указания на синтезированные пользовательские отклики были распределены во множестве 257 старых цифровых элементов согласно распределению откликов, как это описано выше. [0115] In particular, according to some non-limiting embodiments of the present technology, the server 250 may train the algorithm for generating synthesized user responses so that, given a particular approach to selecting old digital items from the old portion 255 of digital items, the algorithm for generating synthesized user responses is capable of: (a) determining, for an old digital item, such as an item from the set 257 of old digital items associated with the provider 247 of old items, a value of the probability of the old digital item receiving, for example, a positive user response; and (b) assigning, based on this probability value, an indication of a synthesized user response for the old digital item so that the indications of the synthesized user responses are distributed in the set 257 of old digital items according to a distribution of responses as described above.

[0116] Например, сервер 250 может назначать указание на синтезированный пользовательский отклик для старого цифрового элемента на основе значения вероятности, связанного с ним, и конкретных порогов вероятности. В частности, если значение вероятности больше заранее заданного верхнего порога вероятности (например, такого как 0,75, 0,80 или 0,9), сервер 250 может назначить для старого цифрового элемента указание на положительный синтезированный пользовательский отклик, а если значение вероятности меньше заранее заданного нижнего порога вероятности (например, такого как 0,1, 0,25 или 0,4), сервер 250 может назначить для старого цифрового элемента указание на отрицательный синтезированный пользовательский отклик. Кроме того, если значение вероятности равно заранее заданному верхнему порогу вероятности (например, такому как 0,75, 0,80 или 0,9), сервер 250 может назначить для старого цифрового элемента указание на то, что старый цифровой элемент был оценен. [0116] For example, the server 250 may assign an indication of a synthesized user response to the old digital item based on a probability value associated with it and specific probability thresholds. In particular, if the probability value is greater than a predetermined upper probability threshold (such as 0.75, 0.80, or 0.9), the server 250 may assign an indication of a positive synthesized user response to the old digital item, and if the probability value is less than a predetermined lower probability threshold (such as 0.1, 0.25, or 0.4), the server 250 may assign an indication of a negative synthesized user response to the old digital item. In addition, if the probability value is equal to a predetermined upper probability threshold (such as 0.75, 0.80, or 0.9), the server 250 may assign an indication to the old digital item that the old digital item has been evaluated.

[0117] Путем обучения алгоритма формирования синтезированных пользовательских откликов, как это описано выше, сервер 250 может определять его конкретные параметры этапа использования, как это описано ниже. Затем сервер 250 может применять алгоритм формирования синтезированных пользовательских откликов с определенными таким образом его параметрами этапа использования в отношении новой части 275 цифровых элементов.[0117] By training the algorithm for generating synthesized user responses as described above, the server 250 can determine its specific parameters of the usage stage as described below. The server 250 can then apply the algorithm for generating synthesized user responses with its parameters of the usage stage thus determined in relation to the new part 275 of the digital elements.

[0118] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, поскольку признаки элемента для новой части 275 цифровых элементов могут быть недоступными, сервер 250 может определять другие признаки для старой части 255 цифровых элементов с целью обучения алгоритма формирования синтезированных пользовательских откликов. В частности, некоторые не имеющие ограничительного характера варианты осуществления настоящей технологии основаны на предположении, что сходство старого цифрового элемента из старой части 255 цифровых элементов и нового цифрового элемента из новой части 275 цифровых элементов может быть определено не только на основе признаков элемента, но и на основе сходства поставщиков старого и нового элементов, а также конкретных признаков, указывающих на популярность элемента, которая связана с новой частью 275 цифровых элементов и может быть получена на основе данных за пределами рекомендательной онлайн-платформы 260. [0118] According to some non-limiting embodiments of the present technology, since the features of the item for the new portion 275 of digital items may not be available, the server 250 may determine other features for the old portion 255 of digital items in order to train the algorithm for generating synthesized user responses. In particular, some non-limiting embodiments of the present technology are based on the assumption that the similarity of the old digital item from the old portion 255 of digital items and the new digital item from the new portion 275 of digital items can be determined not only based on the features of the item, but also based on the similarity of the suppliers of the old and new items, as well as specific features indicating the popularity of the item, which is associated with the new portion 275 of digital items and can be obtained based on data outside the online recommendation platform 260.

[0119] Таким образом, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может представлять значение вероятности как содержащее (а) первое значение вероятности, определенное на основе оценки сходства поставщика старых элементов, связанного со старым цифровым элементом, и множества 245 поставщиков старых элементов, и/или (б) второе значение вероятности, определенное на основе значения параметра популярности, связанного со старым цифровым элементом. [0119] Thus, in some non-limiting embodiments of the present technology, the server 250 may represent the probability value as comprising (a) a first probability value determined based on a similarity score between the old item provider associated with the old digital item and the plurality 245 old item providers, and/or (b) a second probability value determined based on a popularity parameter value associated with the old digital item.

[0120] Ниже описан способ определения сервером 250 первого и второго значений вероятности с учетом распределения откликов для прогнозируемых указаний на пользовательские отклики в старой части 255 цифровых элементов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. [0120] The following describes a method for determining by the server 250 the first and second probability values taking into account the distribution of responses for predicted indications of user responses in the old portion 255 of the digital elements according to some non-limiting embodiments of the present technology.

[0121] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 (см. фиг. 2) может определять первое значение вероятности получения старым цифровым элементом указания на положительный пользовательский отклик на основе оценки сходства поставщика 247 старых элементов, загрузившего этот старый цифровой элемент на рекомендательную онлайн-платформу 260, и множества 245 поставщиков старых элементов согласно следующей формуле: [0121] According to some non-limiting embodiments of the present technology, the server 250 (see FIG. 2) may determine a first value of the probability of receiving an indication of a positive user response by an old digital item based on an assessment of the similarity of the old item provider 247 that uploaded the old digital item to the online recommendation platform 260 and the plurality 245 of old item providers according to the following formula:

, (2) , (2)

где artistScore - оценка сходства поставщика 247 старых элементов со множеством 245 поставщиков старых элементов, a и b - коэффициенты. where artistScore is the similarity score of the supplier of 247 old items with the set of 245 suppliers of old items, a and b are coefficients.

[0122] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, коэффициенты a и b представляют собой параметры из числа параметров этапа использования для алгоритма формирования синтезированных пользовательских откликов. Как более подробно описано ниже, сервер 250 может определять эти коэффициенты с использованием распределения откликов в качестве фактических данных. Иными словами, сервер 250 может определять коэффициенты a и b так, чтобы указания на синтезированные пользовательские отклики, определенные для элементов из старой части 255 цифровых элементов на основе по меньшей мере их первых значений вероятности, были распределены в старой части 255 цифровых элементов согласно распределению откликов для прогнозируемых указаний на пользовательские отклики в старой части 255 цифровых элементов, определенных оценивающей моделью ML, как это описано выше. [0122] According to some non-limiting embodiments of the present technology, the coefficients a and b are parameters from among the parameters of the use stage for the algorithm for generating synthesized user responses. As described in more detail below, the server 250 can determine these coefficients using the distribution of responses as actual data. In other words, the server 250 can determine the coefficients a and b so that the indications of the synthesized user responses determined for the items from the old portion 255 of the digital items based on at least their first probability values are distributed in the old portion 255 of the digital items according to the distribution of responses for the predicted indications of the user responses in the old portion 255 of the digital items determined by the ML evaluation model, as described above.

[0123] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять оценку сходства для поставщика 247 старых элементов на основе значений параметра сходства каждого поставщика из множества 245 поставщиков старых элементов с поставщиком 247 старых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии такой параметр сходства может содержать степень сходства поставщика 247 старых элементов и другого поставщика из множества 245 поставщиков старых элементов. [0123] According to some non-limiting embodiments of the present technology, the server 250 may determine a similarity score for the old item provider 247 based on the values of a similarity parameter of each provider of the plurality of 245 old item providers with the old item provider 247. In some non-limiting embodiments of the present technology, such a similarity parameter may comprise a degree of similarity between the old item provider 247 and another provider of the plurality of 245 old item providers.

[0124] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сходство поставщика 247 старых элементов и другого поставщика из множества поставщиков старых элементов может быть определено на основе по меньшей мере одного связанного с ним признака поставщика элементов. Например, в тех вариантах осуществления изобретения, где рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио, а старый поставщик 247 элементов представляет собой музыканта, признаки поставщика элементов для поставщика 247 старых элементов могут, среди прочего, включать в себя: (а) жанр, в котором работает музыкант; (б) количество альбомов, выпущенных музыкантом; (в) язык, используемый музыкантом; (г) период популярности, связанный с музыкантом; (д) количество потоков для песен музыканта на рекомендательной онлайн-платформе 260; (е) возрастная группа целевой аудитории музыканта; (ж) количество пользователей рекомендательной онлайн-платформы 260, оставивших по меньшей мере одно указание на положительный или отрицательный пользовательский отклик под песнями музыканта; (з) по меньшей мере один пользовательский признак пользователя рекомендательной онлайн-платформы 260, оставившего по меньшей мере одно указание на положительный или отрицательный пользовательский отклик под песнями музыканта, и т.д. [0124] According to some non-limiting embodiments of the present technology, the similarity of the legacy item provider 247 and another provider of the plurality of legacy item providers may be determined based on at least one item provider feature associated therewith. For example, in embodiments where the online recommendation platform 260 is an audio streaming platform and the legacy item provider 247 is a musician, the item provider features of the legacy item provider 247 may include, among other things: (a) the genre in which the musician works; (b) the number of albums released by the musician; (c) the language used by the musician; (d) a period of popularity associated with the musician; (e) the number of streams for the musician's songs on the online recommendation platform 260; (f) the age group of the musician's target audience; (g) the number of users of the online recommendation platform 260 who have left at least one indication of positive or negative user feedback for the musician's songs; (z) at least one user attribute of a user of the online recommendation platform 260 who has left at least one indication of a positive or negative user response under the musician’s songs, etc.

[0125] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять сходство поставщика 247 старых элементов и другого поставщика из множества 245 поставщиков старых элементов путем: (а) формирования для каждого поставщика из множества 245 поставщиков старых элементов вектора признаков поставщика элементов; (б) отображения векторов признаков в многомерное векторное пространство; и (в) определения в многомерном векторном пространстве значения расстояния между векторами признаков поставщиков элементов, представляющими поставщика 247 старых элементов и другого поставщика из множества 245 поставщиков старых элементов. Таким образом, в примере, где поставщик старых элементов представляет собой музыканта, векторы признаков поставщиков элементов музыкантов, использующих один язык или языки одной языковой группы, расположены ближе друг к другу в многомерном векторном пространстве, чем векторы музыкантов, использующих разные языки. В другом примере векторы признаков поставщиков элементов музыкантов, песни которых получили указания на положительный пользовательский отклик от пользователей одной возрастной группы, расположены ближе друг к другу в многомерном векторном пространстве, чем векторы музыкантов, песни которых оценены пользователями разных возрастных групп. [0125] Furthermore, in some non-limiting embodiments of the present technology, the server 250 may determine the similarity of the old item provider 247 and another provider from the plurality of 245 old item providers by: (a) generating, for each provider from the plurality of 245 old item providers, a feature vector of the item provider; (b) mapping the feature vectors to a multi-dimensional vector space; and (c) determining, in the multi-dimensional vector space, a distance value between the feature vectors of the item providers representing the old item provider 247 and the other provider from the plurality of 245 old item providers. Thus, in the example where the old item provider is a musician, the feature vectors of the item providers of musicians who use the same language or languages of the same language group are located closer to each other in the multi-dimensional vector space than the vectors of musicians who use different languages. In another example, the feature vectors of item suppliers of musicians whose songs received indications of positive user feedback from users of the same age group are located closer to each other in the multidimensional vector space than the vectors of musicians whose songs were rated by users of different age groups.

[0126] На основе значений расстояния между поставщиком 247 старых элементов и каждым другим поставщиком из множества 245 поставщиков старых элементов сервер 250 может ранжировать каждого поставщика из множества 245 поставщиков старых элементов относительно поставщика 247 старых элементов и определять таким образом значения параметра сходства между ним и поставщиком 247 старых элементов. [0126] Based on the distance values between the old item supplier 247 and each other supplier of the set 245 old item suppliers, the server 250 may rank each supplier of the set 245 old item suppliers relative to the old item supplier 247 and thereby determine the similarity parameter values between it and the old item supplier 247.

[0127] Кроме того, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, для определения оценки сходства поставщика 247 старых элементов сервер 250 может формировать графовую структуру на основе значений параметра сходства. На фиг. 5 приведено схематическое изображение графа 500 сходства поставщиков элементов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. [0127] In addition, according to some non-limiting embodiments of the present technology, to determine the similarity score of the old item supplier 247, the server 250 may form a graph structure based on the similarity parameter values. Fig. 5 shows a schematic illustration of a similarity graph 500 of item suppliers according to some non-limiting embodiments of the present technology.

[0128] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может формировать граф 500 сходства поставщиков элементов таким образом, что (а) его вершина, такая как первая вершина 502, представляет поставщика старых элементов из множества 245 поставщиков старых элементов, а (б) ребро 506, соединяющее первую вершину 502 и вторую вершину 504, указывает на ненулевое значение параметра сходства между ними, определенного, как это описано выше. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии граф 500 сходства поставщиков элементов может представлять собой ориентированный граф, ребра которого имеют ориентацию, указывающую на то, относительно какого поставщика старых элементов определено значение параметра сходства. [0128] In some non-limiting embodiments of the present technology, the server 250 may form a similarity graph 500 of item suppliers such that (a) a node thereof, such as a first node 502, represents a supplier of old items from the plurality 245 suppliers of old items, and (b) an edge 506 connecting the first node 502 and the second node 504 indicates a non-zero value of a similarity parameter between them, determined as described above. In some non-limiting embodiments of the present technology, the similarity graph 500 of item suppliers may be a directed graph, the edges of which have an orientation indicating with respect to which supplier of old items the value of the similarity parameter is determined.

[0129] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может на основе значений параметра сходства для множества 245 поставщиков старых элементов определять весовые значения переходов между вершинами графа 500 сходства поставщиков элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять весовое значение перехода для пары вершин графа 500 сходства поставщиков элементов как обратно пропорциональное значениям параметра сходства между поставщиками старых элементов, расположенными на этом переходе. В случаях, когда пара вершин соединена ребром, например, первая и вторая вершины 502, 504, соединенные ребром 506, сервер 250 может определять весовое значение перехода от второй вершины 504 к перовой вершине 502 как значение, обратно пропорциональное значению параметра сходства между поставщиками старых элементов, связанными с первой и второй вершинами 502, 504. В другом примере, где пара вершин не имеет непосредственной связи через одно ребро, например, третья вершина 508 и четвертая вершина 510, но имеется переход через пятую вершину 512, сервер 250 может определять весовое значение перехода от третьей вершины 508 к четвертой вершине 510 как значение, определенное по формуле: [0129] In addition, in some non-limiting embodiments of the present technology, the server 250 may, based on the values of the similarity parameter for the plurality 245 of old item suppliers, determine weight values of transitions between nodes of the similarity graph 500 of item suppliers. In some non-limiting embodiments of the present technology, the server 250 may determine the weight value of a transition for a pair of nodes of the similarity graph 500 of item suppliers as inversely proportional to the values of the similarity parameter between the old item suppliers located on this transition. In cases where a pair of nodes are connected by an edge, for example, the first and second nodes 502, 504 connected by an edge 506, the server 250 can determine the weight value of the transition from the second node 504 to the first node 502 as a value inversely proportional to the value of the similarity parameter between the suppliers of old elements associated with the first and second nodes 502, 504. In another example, where a pair of nodes does not have a direct connection through one edge, for example, the third node 508 and the fourth node 510, but there is a transition through the fifth node 512, the server 250 can determine the weight value of the transition from the third node 508 to the fourth node 510 as a value determined by the formula:

, (3) , (3)

где sim(A,C) - значение параметра сходства для третьей и пятой вершин 508, 512, sim(C, B) - значение параметра сходства для пятой и четвертой вершин 512, 510, R - заранее заданный коэффициент, например, равный 10. Where sim(A,C) - the value of the similarity parameter for the third and fifth vertices is 508, 512,sim(C, B) - the value of the similarity parameter for the fifth and fourth vertices 512, 510,R- a predetermined coefficient, for example, equal to 10.

[0130] Кроме того, сервер 250 может определять оценку сходства, связанную со поставщиком 247 старых элементов, как максимальное суммарное весовое значение для перехода от вершины, связанной со поставщиком 247 старых элементов, к вершине, связанной с поставщиком из набора 514 эталонных поставщиков старых элементов (утолщенные линии на фиг. 5). [0130] In addition, the server 250 may determine the similarity score associated with the old item provider 247 as the maximum total weight value for moving from a node associated with the old item provider 247 to a node associated with a provider from the set of 514 reference old item providers (thickened lines in Fig. 5).

[0131] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии каждый поставщик из набора 514 эталонных поставщиков старых элементов может быть выбран из множества 245 поставщиков старых элементов случайным образом. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии набор 514 эталонных поставщиков старых элементов может быть выбран из множества 245 поставщиков старых элементов в виде заданного количества наиболее популярных среди пользователей рекомендательной онлайн-платформы 260 поставщиков старых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять количество наиболее популярных поставщиков старых элементов из множества 245 поставщиков старых элементов путем анализа истории пользовательских действий пользователей рекомендательной онлайн-платформы 260 со старой частью 255 цифровых элементов. Например, сервер 250 может определять количество наиболее популярных поставщиков старых элементов как поставщиков элементов, старые цифровые элементы которых удовлетворяют по меньшей мере одному из следующих условий: (а) их больше всего ищут на рекомендательной онлайн-платформе 260; (б) их больше всего оценивают на рекомендательной онлайн-платформе 260; (в) они получили наибольшее количество указаний на положительные пользовательские отклики на рекомендательной онлайн-платформе 260 и т.д. В другом примере сервер 250 может (а) определять количество лучших поставщиков старых элементов, предлагая, например, с помощью элемента GUI в интерфейсе 300 GUI рекомендательной онлайн-платформы 260, ее пользователям указать несколько, например, 3, 4 или 10, поставщиков из множества 245 поставщиков старых элементов, наиболее интересных для пользователей; и (б) на основе таких указаний определять количество наиболее популярных поставщиков старых элементов, содержащее набор 514 эталонных поставщиков старых элементов. [0131] In some non-limiting embodiments of the present technology, each supplier from the set 514 reference suppliers of old items may be randomly selected from the plurality 245 suppliers of old items. In other non-limiting embodiments of the present technology, the set 514 reference suppliers of old items may be selected from the plurality 245 suppliers of old items as a predetermined number of the most popular suppliers of old items among the users of the online recommendation platform 260. In some non-limiting embodiments of the present technology, the server 250 may determine the number of the most popular suppliers of old items from the plurality 245 suppliers of old items by analyzing the history of user actions of the users of the online recommendation platform 260 with the old portion 255 of digital items. For example, the server 250 may determine the number of the most popular suppliers of old items as the suppliers of items whose old digital items satisfy at least one of the following conditions: (a) they are searched for the most on the online recommendation platform 260; (b) they are rated the most on the online recommendation platform 260; (c) they have received the greatest number of indications of positive user feedback on the online recommendation platform 260, etc. In another example, the server 250 may (a) determine a number of the best suppliers of old items by offering, for example, using a GUI element in the GUI interface 300 of the online recommendation platform 260, its users to indicate several, for example, 3, 4 or 10, suppliers from the set 245 suppliers of old items that are most interesting to users; and (b) based on such indications, determine a number of the most popular suppliers of old items, comprising a set 514 reference suppliers of old items.

[0132] Кроме того, как описано выше, на основе определенной таким образом оценки сходства поставщика 247 старых элементов сервер 250 может определять первое значение вероятности получения старым цифровым элементом из множества 257 старых цифровых элементов указания на положительный пользовательский отклик. [0132] In addition, as described above, based on the thus determined similarity score of the supplier 247 of old items, the server 250 can determine a first value of the probability of receiving an indication of a positive user response by an old digital item from the plurality 257 of old digital items.

[0133] Как описано выше, сервер 250 также может определять второе значение вероятности получения старым цифровым элементом из множества 257 старых цифровых элементов указания на положительный пользовательский отклик на основе значения параметра популярности, связанного со старым цифровым элементом в некоторой области, такой как город, страна, регион и т.п. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определить второе значение вероятности согласно следующему уравнению: [0133] As described above, the server 250 may also determine a second probability value of receiving an indication of a positive user response by an old digital item from the plurality 257 old digital items based on a popularity parameter value associated with the old digital item in a certain area, such as a city, country, region, etc. In some non-limiting embodiments of the present technology, the server 250 may determine the second probability value according to the following equation:

, (4) , (4)

где Popularity - значение популярности старого цифрового элемента в данной области, maxPopularity - значение популярности наиболее популярного в данной области старого цифрового элемента из множества 257 старых цифровых элементов поставщика 247 старых элементов, minPopularity - значение популярности наименее популярного в данной области старого цифрового элемента из множества 257 старых цифровых элементов поставщика 247 старых элементов, c и d - коэффициенты. where Popularity is the popularity value of an old digital element in a given area, maxPopularity is the popularity value of the most popular old digital element in a given area from the set of 257 old digital elements of a supplier of 247 old elements, minPopularity is the popularity value of the least popular old digital element in a given area from the set of 257 old digital elements of a supplier of 247 old elements, c and d are coefficients.

[0134] Подобно коэффициентам a и b из уравнения (2), коэффициенты c и d представляют собой параметры из числа параметров этапа использования для алгоритма формирования синтезированных пользовательских откликов. Таким образом, как более подробно описано ниже, сервер 250 может определять эти коэффициенты так, чтобы указания на синтезированные пользовательские отклики, определенные для элементов из старой части 255 цифровых элементов на основе по меньшей мере их вторых значений вероятности, были распределены в старой части 255 цифровых элементов согласно фактическому распределению откликов для прогнозируемых указаний на пользовательские отклики в старой части 255 цифровых элементов, определенных оценивающей моделью ML, как это описано выше. [0134] Like the coefficients a and b from equation (2), the coefficients c and d are parameters from among the parameters of the use stage for the algorithm for generating synthesized user responses. Thus, as described in more detail below, the server 250 can determine these coefficients so that the indications of the synthesized user responses determined for the elements from the old portion 255 of the digital elements based on at least their second probability values are distributed in the old portion 255 of the digital elements according to the actual distribution of responses for the predicted indications of the user responses in the old portion 255 of the digital elements determined by the ML evaluation model, as described above.

[0135] В контексте настоящего описания, в отличие от популярности элемента, определяемой на основе указаний на пользовательские отклики, оставленные на рекомендательной онлайн-платформе 260, как это описано выше, параметр популярности представляет собой метрику популярности, связанную со старым цифровым элементом и определяемую на основе указаний на пользовательские действия с этим старым цифровым элементом, выполняемые вне рекомендательной онлайн-платформы 260, с использованием других источников, доступных в данной области, таких как радиостанции, телевизионные каналы, музыкальные клубы, живые концерты и т.п., или других онлайн-источников. В частности, в описанном выше примере, где рекомендательная онлайн-платформа 260 представляет собой платформу потокового аудио, а старый цифровой элемент представляет собой аудиопоток, параметр популярности может, среди прочего, включать в себя по меньшей мере одно из следующего: (а) количество потоков аудиопотока на медиа-ресурсе; (б) количество запросов на воспроизведение аудиопотока на медиа-ресурсе; (в) позицию аудиопотока в хит-параде; (г) количество проданных альбомов, содержащих аудиопоток, и т.д. [0135] In the context of the present description, in contrast to the popularity of an item determined based on indications of user responses left on the online recommendation platform 260, as described above, the popularity parameter is a popularity metric associated with an old digital item and determined based on indications of user actions with this old digital item, performed outside the online recommendation platform 260, using other sources available in this area, such as radio stations, television channels, music clubs, live concerts, etc., or other online sources. In particular, in the example described above, where the online recommendation platform 260 is an audio streaming platform and the old digital item is an audio stream, the popularity parameter may, among other things, include at least one of the following: (a) the number of streams of the audio stream on the media resource; (b) the number of requests to play the audio stream on the media resource; (c) the position of the audio stream in the hit parade; (d) the number of albums sold containing the audio stream, etc.

[0136] Кроме того, как описано выше, на основе первого и/или второго значений вероятности сервер 250 может определять значение вероятности получения старым цифровым элементом указания на положительный пользовательский отклик. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии значение вероятности может быть определено на основе только первого значения вероятности. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значение вероятности на основе только второго значения вероятности. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значение вероятности на основе сочетания, например, суммы первого и второго значений вероятности. [0136] In addition, as described above, based on the first and/or second probability values, the server 250 may determine a probability value of the old digital element receiving an indication of a positive user response. In some non-limiting embodiments of the present technology, the probability value may be determined based on only the first probability value. In other non-limiting embodiments of the present technology, the server 250 may determine the probability value based on only the second probability value. In other non-limiting embodiments of the present technology, the server 250 may determine the probability value based on a combination of, for example, the sum of the first and second probability values.

[0137] Кроме того, как описано выше, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов определению его параметров этапа использования, таких как коэффициенты a, b, c и d, для последующего использования при определении указаний на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов. [0137] In addition, as described above, the server 250 may train the algorithm for generating synthesized user responses to determine its usage stage parameters, such as coefficients a, b, c and d , for subsequent use in determining the indications of a synthesized user response for each element of the new portion 275 of digital elements.

[0138] С этой целью, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может: (а) инициализировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов, например, случайным образом; (б) итеративно выполнять алгоритм формирования синтезированных пользовательских откликов, выбирая различные элементы из старой части 255 цифровых элементов; (в) после заранее заданного количества итераций выполнения алгоритма формирования синтезированных пользовательских откликов определять обучающее распределение синтезированных откликов для определенных таким образом указаний на синтезированные пользовательские отклики в старой части 255 цифровых элементов; и (г) корректировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы обучающее распределение синтезированных откликов с требуемой точностью соответствовало распределению откликов для прогнозируемых указаний на пользовательские отклики, определенных оценивающей моделью ML. [0138] To this end, according to some non-limiting embodiments of the present technology, the server 250 may: (a) initialize the parameters of the use stage for the algorithm for generating synthesized user responses, such as randomly; (b) iteratively execute the algorithm for generating synthesized user responses, selecting different elements from the old portion 255 of digital elements; (c) after a predetermined number of iterations of executing the algorithm for generating synthesized user responses, determine a training distribution of synthesized responses for the thus determined indications of synthesized user responses in the old portion 255 of digital elements; and (d) adjust the parameters of the use stage for the algorithm for generating synthesized user responses such that the training distribution of synthesized responses matches with a desired accuracy the distribution of responses for the predicted indications of user responses determined by the ML scoring model.

[0139] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может использовать все элементы из старой части 255 цифровых элементов для обучения алгоритма формирования синтезированных пользовательских откликов. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять обучающий набор старых цифровых элементов, содержащий конкретную часть из старой части 255 цифровых элементов, такую как множества старых цифровых элементов конкретных поставщиков из множества 245 поставщиков старых элементов, которые сервер 250 затем может использовать для обучения алгоритма формирования синтезированных пользовательских откликов. На способ выбора сервером 250 заранее заданного количества итераций выполнения алгоритма формирования синтезированных пользовательских откликов, который может включать в себя выбор этого количества на основе количества цифровых элементов, используемых для обучения алгоритма формирования синтезированных пользовательских откликов, не накладывается ограничений. Например, заранее заданное количество может, среди прочего, соответствовать 100, 1000 или даже десяткам или сотням тысяч итераций.[0139] In some non-limiting embodiments of the present technology, the server 250 may use all of the elements from the old portion 255 of the digital elements to train the algorithm for generating the synthesized user responses. In other non-limiting embodiments of the present technology, the server 250 may determine a training set of old digital elements that includes a specific portion of the old portion 255 of the digital elements, such as sets of old digital elements of specific suppliers from the set 245 of old element suppliers, which the server 250 may then use to train the algorithm for generating the synthesized user responses. There is no limitation on the method for the server 250 to select a predetermined number of iterations of executing the algorithm for generating the synthesized user responses, which may include selecting this number based on the number of digital elements used to train the algorithm for generating the synthesized user responses. For example, the predetermined number may correspond to, among other things, 100, 1000, or even tens or hundreds of thousands of iterations.

[0140] Также не накладывается ограничений на способ выбора сервером 250 старого цифрового элемента из множества 257 старых цифровых элементов, который в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии может включать в себя выбор старого цифрового элемента на основе значения его параметра популярности в данной области, определенного, как это описано выше.[0140] There is also no limitation on the method by which the server 250 selects an old digital item from the plurality 257 old digital items, which in some non-limiting embodiments of the present technology may include selecting an old digital item based on the value of its popularity parameter in the given area, determined as described above.

[0141] Например, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может выбирать старый цифровой элемент из множества 257 старых цифровых элементов для определения его значения вероятности с использованием, среди прочего, одного из следующих подходов: (а) случайным образом; (б) с использованием равномерных вероятностей выбора, т.е. с равными шансами выбора старого цифрового элемента относительно других элементов из множества 257 старых цифровых элементов независимо от значения параметра популярности; (в) с использованием значения вероятности выбора, пропорционального значению параметра популярности, т.е. с большими шансами выбора старого цифрового элемента с большим значением его параметра популярности; и (г) с использованием значения вероятности выбора, пропорционального квадратному корню из значения параметра популярности, т.е. с большими шансами выбора старого цифрового элемента с большим значением квадратного корня из его значения параметра популярности. Также возможны и другие подходы к выбору.[0141] For example, in some non-limiting embodiments of the present technology, the server 250 may select an old digital item from the plurality of 257 old digital items to determine its probability value using, among other things, one of the following approaches: (a) randomly; (b) using uniform selection probabilities, i.e., with an equal chance of selecting an old digital item relative to other items from the plurality of 257 old digital items regardless of the popularity parameter value; (c) using a selection probability value proportional to the popularity parameter value, i.e., with a greater chance of selecting an old digital item with a greater value of its popularity parameter; and (d) using a selection probability value proportional to the square root of the popularity parameter value, i.e., with a greater chance of selecting an old digital item with a greater value of the square root of its popularity parameter value. Other selection approaches are also possible.

[0142] Например, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может корректировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы минимизировать различия между параметрами обучающего распределения синтезированных откликов и распределения откликов. В другом примере сервер 250 может корректировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы графические представления обучающего распределения синтезированных откликов и распределения откликов соответствовали друг другу. Следует отметить, что для определения параметров этапа использования для алгоритма формирования синтезированных пользовательских откликов могут использоваться различные подходы, чтобы обеспечить соответствие по меньшей мере одному из этих условий, включая, например, алгоритмы оптимизации, которые могут, среди прочего, включать в себя алгоритмы, используемые для дифференцируемых целевых функций (такие как алгоритм оптимизации на основе градиентного спуска, алгоритм оптимизации на основе метода Ньютона и т.д.) и недифференцируемых целевых функций (такие как алгоритмы непосредственной оптимизации, алгоритмы стохастической оптимизации, алгоритмы оптимизации популяции и т.д.). Также без выхода за границы настоящей технологии возможны варианты осуществления изобретения, где параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов выбираются эмпирически, чтобы обеспечить соответствие по меньшей мере одному из вышеупомянутых условий. [0142] For example, in some non-limiting embodiments of the present technology, the server 250 may adjust the parameters of the use step for the algorithm for generating synthesized user responses so as to minimize differences between the parameters of the training distribution of the synthesized responses and the response distribution. In another example, the server 250 may adjust the parameters of the use step for the algorithm for generating synthesized user responses so that the graphical representations of the training distribution of the synthesized responses and the response distribution match each other. It should be noted that various approaches may be used to determine the parameters of the use step for the algorithm for generating synthesized user responses in order to ensure that at least one of these conditions is met, including, for example, optimization algorithms, which may include, among other things, algorithms used for differentiable objective functions (such as a gradient descent optimization algorithm, a Newton-based optimization algorithm, etc.) and non-differentiable objective functions (such as direct optimization algorithms, stochastic optimization algorithms, population optimization algorithms, etc.). Also, without going beyond the boundaries of the present technology, embodiments of the invention are possible, where the parameters of the use stage for the algorithm for generating synthesized user responses are selected empirically to ensure compliance with at least one of the above-mentioned conditions.

[0143] Таким образом, в не имеющем ограничительного характера примере сервер 250 может определять параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы уравнения (2) и (4) были представлены следующим образом: [0143] Thus, in a non-limiting example, server 250 may determine the parameters of the use stage for the algorithm for generating synthesized user responses such that equations (2) and (4) are represented as follows:

(5) (5)

[0144] Обученный таким образом алгоритм формирования синтезированных пользовательских откликов сервер 250 может использоваться для определения указаний на синтезированные пользовательские отклики для каждого элемента из новой части 275 цифровых элементов, как это описано ниже. [0144] The thus trained algorithm for generating synthesized user responses, the server 250 can be used to determine indications of synthesized user responses for each element of the new portion 275 of digital elements, as described below.

Алгоритм формирования синтезированных пользовательских откликов. Этап использованияAlgorithm for generating synthesized user responses. Use stage

[0145] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, чтобы использовать обученный алгоритм формирования синтезированных пользовательских откликов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента (не имеющего указания на пользовательский отклик), такого как элемент из множества 277 новых цифровых элементов, связанного с поставщиком 267 новых элементов, сервер 250 может (а) определять для нового цифрового элемента первое и/или второе значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик согласно уравнениям (5); (б) на основе первого и/или второго значений вероятности этапа использования определять значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик; и (в) на основе значения вероятности этапа использования определять указание на отрицательный или положительный синтезированный пользовательский отклик, как это описано выше применительно к обучению алгоритма формирования синтезированных пользовательских откликов. [0145] According to some non-limiting embodiments of the present technology, in order to use the trained algorithm for generating synthetic user responses for the purpose of determining an indication of a synthetic user response for a new digital item (that does not have an indication of a user response), such as an item from the plurality 277 of new digital items associated with the provider 267 of new items, the server 250 may (a) determine for the new digital item a first and/or second value of a probability of a usage step for the new digital item to receive an indication of a positive user response according to equations (5); (b) based on the first and/or second values of a probability of a usage step, determine a probability value of a usage step for the new digital item to receive an indication of a positive user response; and (c) based on the probability value of the usage step, determine an indication of a negative or positive synthetic user response, as described above in connection with training the algorithm for generating synthetic user responses.

[0146] Подобно тому, как это описано выше, сервер 250 может определять первое значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик на основе оценки сходства этапа использования для поставщика 267 новых элементов. С этой целью сервер 250 может (а) определять значения параметра сходства для множества 265 поставщиков новых элементов и (б) формировать граф сходства поставщиков элементов этапа использования подобно графу 500 сходства поставщиков элементов, как это описано выше. Тем не менее, поскольку признаки поставщика элементов из множества 265 поставщиков новых элементов также могут быть недоступными, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может получать значения параметра сходства другим способом. [0146] Similar to what is described above, the server 250 may determine a first value of the probability of the usage stage for the new digital item to receive an indication of a positive user response based on the similarity assessment of the usage stage for the new item provider 267. To this end, the server 250 may (a) determine the values of the similarity parameter for the plurality 265 new item providers and (b) generate a graph of similarity of the item providers of the usage stage similar to the graph 500 of similarity of the item providers as described above. However, since the features of the item provider from the plurality 265 new item providers may also be unavailable, in some non-limiting embodiments of the present technology, the server 250 may obtain the values of the similarity parameter in a different manner.

[0147] В частности, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может получать для каждого поставщика из множества 265 поставщиков новых элементов, такого как новый поставщик 267 элементов, значения параметра сходства относительно поставщиков старых элементов. С этой целью в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значения параметра сходства, связанного с поставщиком 267 новых элементов, на основе оценок, предоставленных оценщиками-людьми. [0147] In particular, in some non-limiting embodiments of the present technology, the server 250 may obtain for each supplier of the plurality 265 suppliers of new items, such as the new supplier 267 of items, values of the similarity parameter relative to the suppliers of old items. To this end, in some non-limiting embodiments of the present technology, the server 250 may determine values of the similarity parameter associated with the supplier 267 of new items based on ratings provided by human raters.

[0148] На фиг. 6 представлено схематическое изображение оценщика-человека 600, определяющего значения сходства между множеством 265 поставщиков новых элементов и поставщиками из множества 245 поставщиков старых элементов согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. [0148] Fig. 6 is a schematic diagram of a human evaluator 600 determining similarity values between a set 265 suppliers of new items and suppliers from a set 245 suppliers of old items according to some non-limiting embodiments of the present technology.

[0149] Очевидно, что оценщик-человек 600 может осуществлять доступ к данным множеств 245, 265 поставщиков старых и новых элементов с помощью электронного устройства, реализованного подобно электронному устройству 210 пользователя 220 и связанному с сервером 250 через сеть 240 связи, как это описано выше. Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии оценщик-человек 600 может включать в себя множество различных оценщиков-людей. [0149] It is obvious that the human evaluator 600 can access the data of the sets 245, 265 of suppliers of old and new items using an electronic device implemented similarly to the electronic device 210 of the user 220 and connected to the server 250 via the communication network 240, as described above. Moreover, in some non-limiting embodiments of the present technology, the human evaluator 600 can include a plurality of different human evaluators.

[0150] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может запрашивать, например, путем передачи указания на задачу ранжирования, оценщика-человека 600 относительно непосредственного предоставления степени сходства между поставщиком 267 новых элементов и, например, заранее заданным количеством (таким как 3, 5, 10 или 20) поставщиков старых элементов из множества 245 поставщиков старых элементов. В ответ оценщик-человек 600 на основе своего восприятия цифровых элементов поставщика 267 новых элементов и множества 245 поставщиков старых элементов может определять набор 602 схожих поставщиков старых элементов. Соответственно, поставщик из набора 602 схожих поставщиков старых элементов может содержать сформированную оценщиком метку 604, указывающую на степень сходства, относящуюся к новому поставщику 267 элементов. Как описано выше, сервер 250 может использовать определенные таким образом степени сходства в качестве значений параметров сходства между каждым из множества 265 поставщиков новых элементов и поставщиками старых элементов из множества 245 поставщиков старых элементов. [0150] According to some non-limiting embodiments of the present technology, the server 250 may request, for example by transmitting an indication of a ranking task, the human evaluator 600 to directly provide a degree of similarity between the new item provider 267 and, for example, a predetermined number (such as 3, 5, 10 or 20) of old item providers from the set 245 of old item providers. In response, the human evaluator 600, based on its perception of the digital elements of the new item provider 267 and the set 245 of old item providers, may determine a set 602 of similar old item providers. Accordingly, a provider from the set 602 of similar old item providers may contain a label 604 generated by the evaluator indicating a degree of similarity related to the new item provider 267. As described above, the server 250 may use the similarity degrees determined in this manner as values of the similarity parameters between each of the plurality 265 new item providers and the old item providers from the plurality 245 old item providers.

[0151] Подобно тому, как это описано выше, сервер 250 может формировать граф сходства поставщиков элементов этапа использования на основе (а) множества 265 поставщиков новых элементов, (б) поставщиков старых элементов, имеющих ненулевое значение параметра сходства с поставщиком из множества 265 поставщиков новых элементов, таких как набор 602 схожих поставщиков старых элементов, связанных с поставщиком 267 новых элементов, и (в) значений параметра сходства между поставщиками по пунктам (а) и (б). [0151] Similar to the above, the server 250 may form a similarity graph of the use stage element suppliers based on (a) the set 265 new element suppliers, (b) old element suppliers that have a non-zero similarity parameter value with a supplier from the set 265 new element suppliers, such as the set 602 similar old element suppliers associated with the new element supplier 267, and (c) the similarity parameter values between suppliers in (a) and (b).

[0152] Кроме того, сервер 250 может определять в графе сходства поставщиков элементов этапа использования для множества 265 поставщиков новых элементов набор новых эталонных поставщиков элементов подобно тому, как это описано выше для графа 500 сходства поставщиков элементов. И наконец, как описано выше, сервер 250 может определять оценку сходства поставщика 267 новых элементов как максимальный суммарный вес перехода в графе сходства поставщиков элементов этапа использования между вершинами, представляющими поставщика 267 новых элементов с поставщиком из набора эталонных поставщиков новых элементов. Соответственно, применяя уравнения (5) в отношении определенной таким образом оценки сходства этапа использования, сервер 250 может определять первое значение вероятности этапа использования для получения новым цифровым элементом положительного пользовательского отклика. [0152] In addition, the server 250 may determine in the similarity graph of the suppliers of the use stage elements for the plurality 265 suppliers of new elements a set of new reference suppliers of elements in the same way as described above for the similarity graph of the suppliers of elements 500. And finally, as described above, the server 250 may determine the similarity score of the supplier 267 of the new elements as the maximum total weight of the transition in the similarity graph of the suppliers of the use stage elements between the nodes representing the supplier 267 of the new elements with a supplier from the set of reference suppliers of new elements. Accordingly, by applying equations (5) with respect to the similarity score of the use stage determined in this way, the server 250 may determine a first value of the probability of the use stage for the new digital element to receive a positive user response.

[0153] Кроме того, как описано выше применительно к старому цифровому элементу, сервер 250 может (а) определять для нового цифрового элемента значение параметра популярности этапа использования и (б) путем применения уравнений (5) в отношении значения параметра популярности этапа использования определять второе значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик. [0153] In addition, as described above with respect to the old digital item, the server 250 may (a) determine for the new digital item a usage stage popularity parameter value and (b) by applying equations (5) with respect to the usage stage popularity parameter value, determine a second usage stage probability value for the new digital item to receive an indication of a positive user response.

[0154] Кроме того, как также описано выше, на основе первого и/или второго значений вероятности этапа использования сервер 250 может определять значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик, на основе которого сервер 250 может определять указание на синтезированный пользовательский отклик для нового цифрового элемента. [0154] In addition, as also described above, based on the first and/or second values of the probability of the stage of use, the server 250 can determine a value of the probability of the stage of use for receiving an indication of a positive user response by the new digital item, based on which the server 250 can determine an indication of a synthesized user response for the new digital item.

[0155] Соответственно, путем итеративного выполнения алгоритма формирования синтезированных пользовательских откликов для заранее заданного количества итераций и выбора на каждой итерации другого нового цифрового элемента из новой части 275 цифровых элементов, как это описано выше применительно к старой части 255 цифровых элементов, сервер 250 может формировать указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов. [0155] Accordingly, by iteratively executing the algorithm for generating synthesized user responses for a predetermined number of iterations and selecting at each iteration a different new digital element from the new portion 275 of digital elements, as described above in relation to the old portion 255 of digital elements, the server 250 can generate an indication of a synthesized user response for each element from the new portion 275 of digital elements.

[0156] В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов другим способом. В частности, в этих вариантах осуществления изобретения сервер 250 может: (а) определять для поставщика 267 новых элементов эталонного поставщика старых элементов из множества 245 поставщиков старых элементов; (б) определять локальное распределение откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов; и (в) назначать для множества 277 новых цифровых элементов, связанных с поставщиком 267 новых элементов, указания на синтезированные пользовательские отклики согласно локальному распределению откликов. [0156] In other non-limiting embodiments of the present technology, the server 250 may determine an indication of a synthesized user response for each item from the new portion 275 of digital items in a different manner. In particular, in these embodiments of the invention, the server 250 may: (a) determine for the provider 267 of new items a reference provider of old items from the plurality 245 providers of old items; (b) determine a local distribution of responses for indications of user responses in the plurality of old digital items associated with the reference provider of old items; and (c) assign for the plurality 277 of new digital items associated with the provider 267 of new items indications of synthesized user responses according to the local distribution of responses.

[0157] На способ определения сервером 250 эталонного поставщика старых элементов для поставщика 267 новых элементов не накладывается ограничений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять эталонного поставщика старых элементов как наиболее схожего с поставщиком 267 новых элементов поставщика из множества 245 поставщиков старых элементов. Например, в этих вариантах осуществления изобретения сервер 250 может определять наиболее схожего с поставщиком 267 новых элементов поставщика из множества 245 поставщиков старых элементов на основе меток оценщиков-людей, как это описано выше со ссылкой на фиг. 6. Например, сервер 250 может определять эталонного поставщика старых элементов для поставщика 267 новых элементов как поставщика с наибольшим рангом из набора 602 схожих поставщиков старых элементов. [0157] There is no limitation on the method for the server 250 to determine the reference supplier of old items for the supplier 267 of new items. In some non-limiting embodiments of the present technology, the server 250 may determine the reference supplier of old items as the most similar to the supplier 267 of new items from the plurality 245 suppliers of old items. For example, in these embodiments of the invention, the server 250 may determine the most similar supplier to the supplier 267 of new items from the plurality 245 suppliers of old items based on the labels of the human raters, as described above with reference to FIG. 6. For example, the server 250 may determine the reference supplier of old items for the supplier 267 of new items as the supplier with the highest rank from the set 602 of similar suppliers of old items.

[0158] В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять эталонного поставщика старых элементов для поставщика 267 новых элементов как наиболее популярного поставщика из множества 245 поставщиков старых элементов, как это описано выше со ссылкой на фиг. 5. [0158] In other non-limiting embodiments of the present technology, the server 250 may determine the reference supplier of old items for the supplier of new items 267 as the most popular supplier from the plurality 245 suppliers of old items, as described above with reference to FIG. 5.

[0159] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять локальное распределение откликов лишь для фактических указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять локальное распределение откликов для прогнозируемых указаний на пользовательские отклики во множестве старых цифровых элементов, определенных оценивающей моделью ML, как это описано выше. [0159] In addition, in some non-limiting embodiments of the present technology, the server 250 may determine a local distribution of responses only for actual user response indications in the plurality of old digital items associated with the reference provider of old items. In other non-limiting embodiments of the present technology, the server 250 may determine a local distribution of responses for predicted user response indications in the plurality of old digital items determined by the ML scoring model, as described above.

[0160] На способ определения сервером 250 локального распределения откликов не накладывается ограничений. Он может включать в себя любые подходы, описанные выше применительно к распределению откликов. [0160] There is no limitation on the method for determining the local distribution of responses by the server 250. It may include any of the approaches described above in relation to the distribution of responses.

[0161] Таким образом, определив локальное распределение указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов, сервер 250 может назначать согласно такому распределению указание на синтезированный пользовательский отклик для каждого элемента из множества 277 новых цифровых элементов. [0161] Thus, having determined a local distribution of indications of user responses in the set of old digital elements of the reference supplier of old elements, the server 250 can assign, according to such distribution, an indication of a synthesized user response for each element of the set 277 of new digital elements.

[0162] Например, можно предположить, что множество старых цифровых элементов эталонного поставщика старых элементов содержит пять старых цифровых элементов с указаниями на положительный или отрицательный пользовательский отклик, распределенными в нем следующим образом: [100/25; 108000/580; 9995874/36954; 135001/398; 127/24]. Таким образом, с использованием этого локального распределения откликов сервер 250 может назначать указания на синтезированные пользовательские отклики для множества 277 новых цифровых элементов так, чтобы минимизировать различия между параметрами, такими как математическое ожидание и среднеквадратическое отклонение, для локального распределения откликов и сформированного таким образом распределения указаний на синтезированный пользовательский отклик во множестве 277 новых цифровых элементов (описано выше). Таким образом, если множество 277 новых цифровых элементов также содержит пять цифровых элементов, то сервер 250 может определять для него указания на синтезированные пользовательские отклики, совпадающие с локальным распределением откликов из описанного выше примера. Можно сказать, что в результате сервер 250 имитирует локальное распределение откликов для указаний на пользовательские отклики во множестве старых цифровых элементов с целью формирования указаний на синтезированные пользовательские отклики для каждого элемента из множества 277 новых цифровых элементов. [0162] For example, it can be assumed that the set of old digital elements of the reference supplier of old elements contains five old digital elements with indications of a positive or negative user response distributed therein as follows: [100/25; 108000/580; 9995874/36954; 135001/398; 127/24]. Thus, using this local distribution of responses, the server 250 can assign indications of synthesized user responses to the set 277 of new digital elements so as to minimize the differences between parameters, such as the mathematical expectation and the standard deviation, for the local distribution of responses and the thus formed distribution of indications of a synthesized user response in the set 277 of new digital elements (described above). Thus, if the set 277 of new digital elements also contains five digital elements, then the server 250 can determine for it indications of synthesized user responses that coincide with the local distribution of responses from the example described above. As a result, it can be said that the server 250 simulates the local distribution of responses for indications of user responses in the set of old digital elements in order to generate indications of synthesized user responses for each element of the set 277 of new digital elements.

[0166] Таким образом, определив указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов, сервер 250 может использовать новую часть 275 цифровых элементов для обучения алгоритма 280 MLA определению набора 225 рекомендуемых цифровых элементов, как это описано выше. В частности, сервер 250 может формировать новый обучающий набор данных, содержащий множество новых обучающих цифровых объектов, каждый из которых содержит по меньшей мере (а) указание на новый цифровой элемент из новой части 275 цифровых элементов и (б) по меньшей мере одно указание на синтезированный пользовательский отклик, определенный как это описано выше. Кроме того, сервер 250 на основе множества новых обучающих цифровых объектов может обучать алгоритм 280 MLA определению значения вероятности положительного действия пользователя 220 с новым цифровым элементом и на основе этого значения вероятности определять набор рекомендуемых цифровых элементов из числа других элементов из старой и новой частей 255, 275 цифровых элементов. [0166] Thus, having determined an indication of a synthesized user response for each item from the new portion 275 of digital items, the server 250 can use the new portion 275 of digital items to train the MLA algorithm 280 to determine a set 225 of recommended digital items, as described above. In particular, the server 250 can form a new training data set that contains a plurality of new training digital objects, each of which contains at least (a) an indication of a new digital item from the new portion 275 of digital items and (b) at least one indication of a synthesized user response determined as described above. In addition, the server 250, based on the plurality of new training digital objects, can train the MLA algorithm 280 to determine a probability value of a positive action by the user 220 with the new digital item and, based on this probability value, determine a set of recommended digital items from among other items from the old and new portions 255, 275 of digital items.

[0164] В не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 280 MLA может основываться на нейронных сетях (NN, Neural Network), на сверточных сетях NN (CNN, Сonvolutional NN), на сетях на основе трансформера, на моделях дерева решений, на алгоритме MLA на основе дерева решений с градиентным бустингом, на алгоритме MLA на основе обучения правилам ассоциации, на алгоритме MLA на основе глубокого обучения, на алгоритме MLA на основе индуктивного логического программирования, на алгоритме MLA на основе метода опорных векторов, на алгоритме MLA на основе кластеризации, на байесовских сетях, на алгоритме MLA на основе обучения с подкреплением, на алгоритме MLA на основе обучения представлению, на алгоритме MLA на основе обучения сходству и метрикам, на алгоритме MLA на основе обучения на скудном словаре, на алгоритме MLA на основе генетических алгоритмов и т.п. Для обучения алгоритма 280 сервер 250 может использовать подход обучения с учителем без выхода за границы настоящей технологии. [0164] In non-limiting embodiments of the present technology, the MLA algorithm 280 may be based on neural networks (NN), convolutional NN (CNN), transformer-based networks, decision tree models, a gradient boosted decision tree MLA algorithm, an association rule learning MLA algorithm, a deep learning MLA algorithm, an inductive logic programming MLA algorithm, a support vector machine MLA algorithm, a clustering MLA algorithm, Bayesian networks, a reinforcement learning MLA algorithm, a representation learning MLA algorithm, a similarity and metrics learning MLA algorithm, a sparse dictionary learning MLA algorithm, a genetic algorithm MLA algorithm, etc. To train algorithm 280, server 250 may use a supervised learning approach without going beyond the boundaries of the current technology.

[0165] Ниже со ссылкой на фиг. 7 описан пример модели машинного обучения на основе которой может быть реализован алгоритм 280 MLA, а также процесс его обучения согласно по меньшей мере некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии.[0165] Below, with reference to Fig. 7, an example of a machine learning model on the basis of which the MLA algorithm 280 can be implemented, as well as a process for training it, according to at least some non-limiting embodiments of the present technology, is described.

Архитектура модели машинного обучения Machine learning model architecture

[0166] На фиг. 7 представлена схема модели 700 дерева решений, которая может использоваться с по меньшей мере некоторыми не имеющими ограничительного характера вариантами осуществления настоящей технологии. Модель 700 дерева решений предназначена для иллюстрации модели дерева решений общего назначения, которая может быть модифицирована так, чтобы соответствовать требованиям к конкретной модели прогнозирования, такой как алгоритм 280 MLA. Например, такие модификации могут, в числе прочего, включать в себя добавление или удаление одного или нескольких уровней дерева, добавление или удаление узлов (т.е. признаков и связанных с ними разветвлений), добавление или удаление ветвей, соединяющих узлы и/или листья дерева. [0166] Fig. 7 is a diagram of a decision tree model 700 that can be used with at least some non-limiting embodiments of the present technology. The decision tree model 700 is intended to illustrate a general-purpose decision tree model that can be modified to meet the requirements of a particular prediction model, such as the MLA algorithm 280. For example, such modifications can include, among other things, adding or removing one or more levels of the tree, adding or removing nodes (i.e., features and associated branches), adding or removing branches connecting nodes and/or leaves of the tree.

[0167] Модель 700 дерева решений может представлять собой обученную модель дерева. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сформированная модель 700 дерева решений может быть обновлена и/или модифицирована, например, для повышения точности модели машинного обучения и/или для расширения области применения модели машинного обучения. В частности, в некоторых вариантах осуществления изобретения на модели 700 дерева решений может, в числе прочего, основываться определение значений вероятности положительного действия пользователей рекомендательной онлайн-системы 260, таких как пользователь 220, с каждым элементом из множества 235 цифровых элементов, размещенных на рекомендательной онлайн-платформе 260. Также возможны и другие области применения модели 700 дерева решений без выхода за границы настоящей технологии.[0167] The decision tree model 700 may be a trained tree model. In some non-limiting embodiments of the present technology, the generated decision tree model 700 may be updated and/or modified, for example, to improve the accuracy of the machine learning model and/or to expand the scope of application of the machine learning model. In particular, in some embodiments of the invention, the decision tree model 700 may be used, among other things, to determine the values of the probability of a positive action of users of the online recommender system 260, such as the user 220, with each element of the plurality 235 digital elements posted on the online recommender platform 260. Other areas of application of the decision tree model 700 are also possible without going beyond the scope of the present technology.

[0168] Модель 700 дерева решений содержит первый узел 702, связанный с первым признаком f1. Первый узел 702 образует первый уровень модели 700 дерева решений. Первый узел 702 связан ветвями со вторым узлом 704 и с третьим узлом 706. Второй узел 704 и третий узел 706 связаны со вторым признаком f2. Второй узел 704 и третий узел 706 образуют второй уровень модели 700 дерева решений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии первый признак f1 (и разветвление для первого признака f1) выбран из набора признаков для размещения на первом уровне модели 700 дерева решений на основе множества обучающих цифровых объектов. Например, этот признак может характеризовать цифровой элемент и/или взаимодействовавшего с ним пользователя и/или способ взаимодействия пользователя с элементом (более подробно описано ниже). [0168] The decision tree model 700 comprises a first node 702 associated with a first feature f1. The first node 702 forms a first level of the decision tree model 700. The first node 702 is connected by branches to a second node 704 and to a third node 706. The second node 704 and the third node 706 are associated with a second feature f2. The second node 704 and the third node 706 form a second level of the decision tree model 700. In some non-limiting embodiments of the present technology, the first feature f1 (and the branching for the first feature f1) is selected from a set of features for placement at the first level of the decision tree model 700 based on a plurality of training digital objects. For example, this feature may characterize the digital item and/or the user who interacted with it and/or the method of the user interacting with the item (described in more detail below).

[0169] Первый признак f1 выбирается так, что для цифрового объекта значение параметра, связанного с первым признаком f1, определяет то, со вторым узлом 704 или с третьим узлом 706 должен быть связан этот цифровой объект. Например, если значение меньше значения f1, цифровой объект связан со вторым узлом 704. В другом примере, если значение большее значения f1, цифровой объект связан с третьим узлом 706.[0169] The first feature f1 is selected such that for a digital object, the value of the parameter associated with the first feature f1 determines whether the digital object should be associated with the second node 704 or with the third node 706. For example, if the value is less than the value f1, the digital object is associated with the second node 704. In another example, if the value is greater than the value f1, the digital object is associated with the third node 706.

[0170] В свою очередь, второй узел 704 связан с четвертым узлом 708, связанным с третьим признаком f3, и с пятым узлом 710, связанным с третьим признаком f3. Третий узел 706 связан с шестым узлом 712, связанным с третьим признаком f3, и с седьмым узлом 714, связанным с третьим признаком f3. Четвертый узел 708, пятый узел 710, шестой узел 712 и седьмой узел 714 образуют третий уровень модели 700 дерева решений. Как описано выше применительно к первому узлу 702, для цифрового объекта значение параметра, связанного со вторым признаком f2, определяет то, с четвертым узлом 708 или с пятым узлом 710 (если цифровой объект связан со вторым узлом 704) либо с шестым узлом 712 или с седьмым узлом 714 (если цифровой объект связан с третьим узлом 706) должен быть связан этот цифровой объект.[0170] In turn, the second node 704 is connected with the fourth node 708, connected with the third feature f3, and with the fifth node 710, connected with the third feature f3. The third node 706 is connected with the sixth node 712, connected with the third feature f3, and with the seventh node 714, connected with the third feature f3. The fourth node 708, the fifth node 710, the sixth node 712 and the seventh node 714 form the third level of the decision tree model 700. As described above with respect to the first node 702, for a digital object, the value of the parameter associated with the second feature f2 determines whether this digital object should be associated with the fourth node 708 or with the fifth node 710 (if the digital object is associated with the second node 704) or with the sixth node 712 or with the seventh node 714 (if the digital object is associated with the third node 706).

[0171] В свою очередь, все узлы из числа четвертого узла 708, пятого узла 710, шестого узла 712 и седьмого узла 714 связаны с наборами прогнозируемых параметров. В представленном на фиг. 7 примере наборы прогнозируемых параметров содержат первый набор 720, второй набор 722, третий набор 724 и четвертый набор 726. Каждый набор из числа наборов прогнозируемых параметров содержит три целевых значения C1, C2 и C3, например, предоставленных оценщиками-людьми (как это описано ниже).[0171] In turn, all nodes from the fourth node 708, the fifth node 710, the sixth node 712 and the seventh node 714 are associated with sets of predicted parameters. In the example shown in Fig. 7, the sets of predicted parameters comprise a first set 720, a second set 722, a third set 724 and a fourth set 726. Each set from among the sets of predicted parameters comprises three target values C1, C2 and C3, for example, provided by human assessors (as described below).

[0172] Как должно быть понятно специалисту в области настоящей технологии, модель 700 дерева решений иллюстрирует вариант осуществления изобретения, в котором конкретный уровень модели 700 дерева решений связан с одним признаком. В представленном на фиг. 7 примере первый уровень содержит первый узел 702 и связан с первым признаком f1, второй уровень содержит второй узел 704 и третий узел 706 и связан со вторым признаком f2, третий уровень содержит четвертый узел 708, пятый узел 710, шестой узел 712 и седьмой узел 714 и связан с третьим признаком f3. [0172] As will be understood by one skilled in the art, the decision tree model 700 illustrates an embodiment of the invention, in which a particular level of the decision tree model 700 is associated with one feature. In the example shown in Fig. 7, the first level contains the first node 702 and is associated with the first feature f1, the second level contains the second node 704 and the third node 706 and is associated with the second feature f2, the third level contains the fourth node 708, the fifth node 710, the sixth node 712 and the seventh node 714 and is associated with the third feature f3.

[0173] Иными словами, в представленном на фиг. 7 варианте осуществления изобретения первый уровень связан с первым признаком f1, второй уровень связан со вторым признаком f2, третий уровень связан с третьим признаком f3. Тем не менее, возможны и другие варианты осуществления изобретения. В частности, возможен альтернативный вариант осуществления изобретения, в котором сформированная модель дерева может содержать различные признаки для некоторого уровня модели дерева. Например, первый уровень такой модели дерева может содержать первый узел, связанный с первым признаком f1, второй уровень может содержать второй узел, связанный со вторым признаком f2, и третий узел, связанный с третьим признаком f3. Как должно быть понятно специалисту в области настоящей технологии, возможны и другие варианты сопоставления признаков с уровнем без выхода за границы настоящей технологии.[0173] In other words, in the embodiment of the invention shown in Fig. 7, the first level is associated with the first feature f1, the second level is associated with the second feature f2, and the third level is associated with the third feature f3. However, other embodiments of the invention are also possible. In particular, an alternative embodiment of the invention is possible, in which the generated tree model may contain different features for a certain level of the tree model. For example, the first level of such a tree model may contain a first node associated with the first feature f1, the second level may contain a second node associated with the second feature f2, and a third node associated with the third feature f3. As should be clear to a person skilled in the art, other options for associating features with a level are also possible without going beyond the scope of the present technology.

[0174] На выбор признаков, таких как первый признак f1, второй признак f2 и третий признак f3, для формирования модели 700 дерева решений не накладывается ограничений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии выбор признаков и, следовательно, разветвлений между узлами модели 700 дерева решений, может включать в себя оптимизацию метрики, указывающей на качество признака для разделения по ветвям модели 700 дерева решений множества обучающих цифровых объектов в процессе обучения, по мере подачи каждого объекта из множества обучающих цифровых объектов в модель 700 дерева решений. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии такая метрика может включать в себя метрику оценки корректности положительных результатов (Estimate of Positive Correctness), метрику «примеси Джини» (Gini Impurity), метрику прироста информации (Information Gain) и т.п. В конкретных не имеющих ограничительного характера вариантах осуществления настоящей технологии признаки могут выбираться на основе максимизации параметра качества прогнозирования протодеревьев, из которых состоит модель 700 дерева решений, например, как описано в патентной заявке US2019164084A1 «Method of and system for generating prediction quality parameter for a prediction model executed in a machine learning algorithm» (опубликована 30 мая 2019 г.), содержание которой полностью включено в настоящий документ посредством ссылки. [0174] There are no restrictions on the selection of features, such as the first feature f1, the second feature f2 and the third feature f3, for forming the decision tree model 700. In some non-limiting embodiments of the present technology, the selection of features and, therefore, branches between nodes of the decision tree model 700, may include optimizing a metric indicating the quality of a feature for dividing a plurality of training digital objects into branches of the decision tree model 700 during the training process, as each object of the plurality of training digital objects is fed to the decision tree model 700. In some non-limiting embodiments of the present technology, such a metric may include an Estimate of Positive Correctness metric, a Gini Impurity metric, an Information Gain metric, and the like. In certain non-limiting embodiments of the present technology, the features may be selected based on maximizing the prediction quality parameter of the proto-trees that comprise the decision tree model 700, such as described in patent application US2019164084A1, “Method of and system for generating prediction quality parameter for a prediction model executed in a machine learning algorithm” (published May 30, 2019), the contents of which are incorporated herein by reference in their entirety.

[0175] Кроме того, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, алгоритм 280 MLA может содержать один экземпляр модели 700 дерева решений. В этом случае алгоритм MLA может называться одиночным деревом решений. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 280 MLA может содержать ансамбль деревьев решений, реализованных подобно модели 700 дерева решений. Тогда алгоритм 280 MLA может называться лесом деревьев решений. В этом случае окончательный прогноз ансамбля деревьев решений основывается на результатах прогнозирования каждого дерева решений ансамбля. На построение ансамбля деревьев решений не накладывается ограничений, например, оно может включать в себя использование подхода на основе бустинга, такого как подход на основе градиентного бустинга. [0175] Furthermore, according to some non-limiting embodiments of the present technology, the MLA algorithm 280 may comprise a single instance of the decision tree model 700. In this case, the MLA algorithm may be referred to as a single decision tree. In other non-limiting embodiments of the present technology, the MLA algorithm 280 may comprise an ensemble of decision trees implemented similarly to the decision tree model 700. Then, the MLA algorithm 280 may be referred to as a forest of decision trees. In this case, the final prediction of the ensemble of decision trees is based on the prediction results of each decision tree in the ensemble. There are no limitations on how the ensemble of decision trees is constructed, for example, it may include using a boosting-based approach, such as a gradient boosting-based approach.

[0176] В общем случае бустинг представляет собой способ построения ансамбля деревьев решений, где деревья строятся поэтапно (в отличие от формирования случайного леса, где деревья могут формироваться параллельно) так, что различие между целевыми значениями и прогнозируемыми выходными данными ансамбля деревьев решений минимизируется на каждой итерации при формировании каждого нового дерева решений. Например, различие между целевыми значениями и результатами прогнозирования ансамбля деревьев решений может выражаться функцией потерь, такой как функция потерь кросс-энтропии. [0176] In general, boosting is a method for constructing an ensemble of decision trees where the trees are constructed in stages (as opposed to forming a random forest, where the trees may be formed in parallel) such that the difference between the target values and the predicted output of the ensemble of decision trees is minimized at each iteration as each new decision tree is formed. For example, the difference between the target values and the prediction output of the ensemble of decision trees may be expressed by a loss function, such as the cross-entropy loss function.

[0177] Должно быть понятно, что в не имеющих ограничительного характера вариантах осуществления настоящей технологии возможны и другие варианты реализации функции потерь, например, функция потерь среднеквадратичной ошибки, функция потерь по Губеру, кусочно-линейная функция потерь и т.д. [0177] It should be understood that in non-limiting embodiments of the present technology, other embodiments of the loss function are also possible, for example, a mean square error loss function, a Huber loss function, a piecewise linear loss function, etc.

[0178] Иными словами, применяя подход на основе бустинга, алгоритм 280 MLA использует деревья решений в качестве слабых учеников, которых алгоритм 280 MLA последовательно объединяет таким образом, чтобы каждый новый ученик соответствовал невязкам предыдущей итерации, улучшая совокупный результат всего ансамбля деревьев решений. Иными словами, каждое дерево решений строится на одном и том же множестве обучающих цифровых объектов, при этом обучающие цифровые объекты, для которых первое дерево решений допустило «ошибки» при прогнозировании, имеют приоритет при построении второго дерева решений и т.д. Затем алгоритм 280 MLA объединяет результаты каждой итерации, формируя сильного ученика. [0178] In other words, using a boosting approach, the MLA algorithm 280 uses decision trees as weak learners, which the MLA algorithm 280 sequentially combines in such a way that each new learner matches the residuals of the previous iteration, improving the combined result of the entire ensemble of decision trees. In other words, each decision tree is built on the same set of training digital objects, and training digital objects for which the first decision tree made "errors" in predicting are given priority when building the second decision tree, and so on. The MLA algorithm 280 then combines the results of each iteration to form a strong learner.

[0179] В конкретных не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 280 MLA может содержать ансамбль деревьев решений CatBoost как, например, это описано в работе «CatBoost: gradient boosting with categorical features support» (Dorogush et al., опубликована компанией Yandex Inc.), содержание которой полностью включено в настоящий документ посредством ссылки. [0179] In certain non-limiting embodiments of the present technology, the MLA algorithm 280 may comprise an ensemble of CatBoost decision trees, such as those described in “CatBoost: gradient boosting with categorical features support” (Dorogush et al., published by Yandex Inc.), the contents of which are incorporated herein by reference in their entirety.

[0180] В общем случае можно сказать, что процессор сервера 250 должен выполнять два процесса, относящихся к алгоритму 280 MLA. Первый процесс из числа этих двух процессов представляет собой процесс обучения, где процессор 110, например, сервера 250, способен обучать алгоритм 280 MLA на основе множества обучающих цифровых объектов (также называемого обучающим набором данных) определению значений вероятности положительного действия пользователя 220 с каждым элементом из множества 235 цифровых элементов. [0180] In general, it can be said that the processor of the server 250 must perform two processes related to the MLA algorithm 280. The first process of these two processes is a training process, where the processor 110, for example, of the server 250, is capable of training the MLA algorithm 280 based on a plurality of training digital objects (also called a training data set) to determine the values of the probability of a positive action of the user 220 with each element of the plurality 235 of digital elements.

[0181] Второй процесс представляет собой процесс этапа использования, где процессор сервера 250 выполняет обученный таким образом алгоритм 280 MLA для определения значений вероятности положительного действия пользователя 220 с каждым элементом из множества 235 цифровых элементов согласно не имеющим ограничительного характера вариантам осуществления настоящей технологии. Тем не менее в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм MLA может быть обучен на стороннем сервере, а сервер 250 может выполнять алгоритм 280 MLA. [0181] The second process is a process of the use stage, where the processor of the server 250 executes the MLA algorithm 280 trained in this way to determine the values of the probability of a positive action of the user 220 with each element of the plurality 235 digital elements according to non-limiting embodiments of the present technology. However, in some non-limiting embodiments of the present technology, the MLA algorithm may be trained on a third-party server, and the server 250 may execute the MLA algorithm 280.

[0182] Должно быть понятно, что в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 280 MLA может содержать несколько моделей машинного обучения, способных определять значения вероятности положительного действия пользователя 220 со множеством 235 цифровых элементов. В частности, наряду с описанной выше моделью 700 дерева решений, алгоритм 280 MLA может содержать дополнительные модели машинного обучения. В различных не имеющих ограничительного характера вариантах осуществления настоящей технологии дополнительная модель машинного обучения может, например, содержать углубленную структурированную семантическую модель машинного обучения. В различных не имеющих ограничительного характера вариантах осуществления настоящей технологии углубленная структурированная семантическая модель машинного обучения может быть обучена сервером 250 на основе того же или иного множества обучающих цифровых объектов, используемого для обучения модели 700 дерева решений. [0182] It should be understood that in some non-limiting embodiments of the present technology, the MLA algorithm 280 may comprise several machine learning models capable of determining the values of the probability of a positive action of the user 220 with the plurality 235 digital items. In particular, in addition to the decision tree model 700 described above, the MLA algorithm 280 may comprise additional machine learning models. In various non-limiting embodiments of the present technology, the additional machine learning model may, for example, comprise an advanced structured semantic machine learning model. In various non-limiting embodiments of the present technology, the advanced structured semantic machine learning model may be trained by the server 250 based on the same or a different plurality of training digital objects used to train the decision tree model 700.

[0183] Обучив алгоритм 280 MLA на основе нового обучающего набора данных, сервер 250 может представить по меньшей мере некоторые элементы из новой части 275 цифровых элементов пользователю 220 в качестве части набора 225 рекомендуемых цифровых элементов. [0183] After training the MLA algorithm 280 based on the new training data set, the server 250 may present at least some items from the new portion 275 of digital items to the user 220 as part of the set 225 of recommended digital items.

[0184] После представления пользователю 220 нового цифрового элемента из новой части 275 цифровых элементов путем назначения для него указания на синтезированный пользовательский отклик, как это описано выше, сервер 250 может получить указание на пользовательский отклик от пользователя 220. Если указание на пользовательский отклик от пользователя 220 отличается от указания на синтезированный пользовательский отклик, то сервер 250 может заменить последнее на первое. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может добавлять указание на пользовательский отклик от пользователя 220 к сформированному таким образом указанию на синтезированный пользовательский отклик.[0184] After presenting a new digital item from the new portion 275 of digital items to the user 220 by assigning an indication of a synthesized user response to it, as described above, the server 250 may receive an indication of a user response from the user 220. If the indication of a user response from the user 220 differs from the indication of a synthesized user response, the server 250 may replace the latter with the former. In other non-limiting embodiments of the present technology, the server 250 may add an indication of a user response from the user 220 to the indication of a synthesized user response thus generated.

Первый способThe first way

[0185] Описанные выше архитектура и примеры позволяют выполнять способ формирования обучающего набора данных для обучения алгоритма MLA, такого как алгоритм 280 MLA, формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы 260. На фиг. 8 представлена блок-схема первого способа 800 согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. Способ 800 может выполняться сервером 250. [0185] The architecture and examples described above allow for a method of generating a training data set for training an MLA algorithm, such as the MLA algorithm 280, to generate recommendations of digital items for users of the online recommendation platform 260. Fig. 8 shows a flow chart of a first method 800 according to some non-limiting embodiments of the present technology. The method 800 can be performed by the server 250.

[0186] Как описано выше, сервер 250 может формировать обучающий набор данных для обучения алгоритма MLA путем формирования указаний на синтезированный пользовательский отклик для новых цифровых элементов, не имеющих указаний на фактические пользовательские отклики от пользователей рекомендательной онлайн-платформы 260.[0186] As described above, the server 250 may generate a training data set for training the MLA algorithm by generating indications of a synthesized user response for new digital items that do not have indications of actual user responses from users of the online recommendation platform 260.

Шаг 802: получение сервером указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом.Step 802: receiving by the server indications of the old portion of the digital elements for the purpose of forming a plurality of training digital objects for evaluation, each of which contains (a) the old digital element from the old portion of the digital elements and (b) an indication of the user response received by the old digital element.

[0187] Первый способ 800 начинается с шага 802, на котором сервер 250 способен обучать оценивающую модель ML определению указаний на синтезированный пользовательский отклик для цифровых элементов, таких как новая часть 275 цифровых элементов. Как описано выше, с этой целью сервер 250 может: (а) обучать оценивающую модель ML определению прогнозируемых указаний на пользовательские отклики для элементов из старой части 255 цифровых элементов, не имеющих указаний на пользовательские отклики; (б) определять распределение откликов для прогнозируемых указаний на пользовательские отклики в старой части цифровых элементов; и (в) на основе распределения откликов определять параметры этапа использования для алгоритма формирования синтезированных откликов, включая коэффициенты уравнений (2) и (4), для последующего использования при определении указаний на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов. [0187] The first method 800 begins with step 802, in which the server 250 is capable of training an ML scoring model to determine indications of a synthesized user response for digital items, such as the new portion 275 of the digital items. As described above, to this end, the server 250 may: (a) train an ML scoring model to determine predicted indications of user responses for items from the old portion 255 of the digital items that do not have indications of user responses; (b) determine a distribution of responses for the predicted indications of user responses in the old portion of the digital items; and (c) based on the distribution of responses, determine the parameters of the use stage for the algorithm for generating synthesized responses, including the coefficients of equations (2) and (4), for subsequent use in determining indications of a synthesized user response for each item from the new portion 275 of the digital items.

[0188] Как описано выше со ссылкой на фиг. 4A и 4Б, сервер 250 может обучать оценивающую модель ML определению прогнозируемых указаний на пользовательские отклики, таких как прогнозируемое указание 408 для пользователя 220, для другого элемента из старой части 255 цифровых элементов на основе фактических указаний на пользовательские отклики, таких как фактическое указание 406, предоставленное пользователем 220 для элемента из старой части 255 цифровых элементов. [0188] As described above with reference to Figs. 4A and 4B, server 250 may train an ML scoring model to determine predicted user response indications, such as a predicted indication 408 for user 220, for another item from old portion 255 of digital items based on actual user response indications, such as an actual indication 406 provided by user 220 for an item from old portion 255 of digital items.

[0189] Как описано выше, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии оценивающая модель ML содержит модель ML матричной факторизации, для обучения которой, как это описано со ссылкой на фиг. 4A, сервер 250 может формировать входную матрицу 402, содержащую множество обучающих цифровых объектов для оценивания. В частности, входная матрица 402 имеет размер m*n, где m - количество пользователей рекомендательной онлайн-платформы 260, n - количество старых цифровых элементов в старой части 255 цифровых элементов. Таким образом, элемент входной матрицы 402, представляющий обучающий цифровой объект для оценивания из множества обучающих цифровых объектов для оценивания, содержит: (а) фактическое указание 406 на пользовательский отклик, предоставленный пользователем 220 для старого цифрового элемента из старой части 255 цифровых элементов; (б) признаки элемента для старого цифрового элемента; и (в) пользовательские признаки пользователя 220, сформировавшего фактическое указание 406 под старым цифровым элементом. [0189] As described above, in some non-limiting embodiments of the present technology, the ML rating model comprises a matrix factorization ML model, for training which, as described with reference to Fig. 4A, the server 250 can generate an input matrix 402 comprising a plurality of training digital objects for rating. In particular, the input matrix 402 has a size of m*n , where m is the number of users of the online recommendation platform 260, n is the number of old digital items in the old portion 255 of digital items. Thus, an element of the input matrix 402 representing a training digital object for rating from the plurality of training digital objects for rating comprises: (a) an actual indication 406 of a user response provided by the user 220 for an old digital item from the old portion 255 of digital items; (b) element features for the old digital item; and (c) user attributes of the user 220 who generated the actual indication 406 under the old digital element.

[0190] Далее первый способ 800 продолжается на шаге 804. [0190] The first method 800 then continues at step 804.

Шаг 804: ввод сервером множества цифровых объектов для оценивания в оценивающую модель ML и обучение таким образом оценивающей модели ML определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных.Step 804: inputting a plurality of digital objects for evaluation into an ML evaluation model by the server, and thereby training the ML evaluation model to determine a predicted user response indication for the digital item using the response distribution for user response indications in the old portion of the digital items as actual data.

[0191] На шаге 804 сервер 250 на основе множества обучающих цифровых объектов для оценивания, представленных с помощью входной матрицы 402, может обучать оценивающую модель ML определению указания на синтезированный пользовательский отклик для нового цифрового элемента с использованием распределения откликов в качестве фактических данных. [0191] In step 804, the server 250, based on the plurality of training digital objects for evaluation represented by the input matrix 402, may train an ML evaluation model to determine an indication of a synthesized user response for a new digital item using the distribution of responses as factual data.

[0192] С этой целью, как подробно описано со ссылкой на фиг. 4A и 4Б, сервер 250 сначала может обучать оценивающую модель ML определению прогнозируемых указаний на пользовательские отклики путем определения на основе входной матрицы 402 матриц P и Q векторных представлений пользователей и элементов так, что элементы выходной матрицы 404, определяемой как PQ T , обеспечивают близкую аппроксимацию элементов входной матрицы 402. Определенная таким образом выходная матрица 404: (а) для элемента из старой части 255 цифровых элементов, который ранее не имел указания на пользовательский отклик, содержит прогнозируемое указание 408 на пользовательский отклик; и (б) для элементов из старой части 255 цифровых элементов, имевших фактические указания на пользовательские отклики, таких как старый цифровой элемент, связанный с фактическим указанием 406 на пользовательский отклик, аппроксимирует такие указания с требуемой точностью.[0192] To this end, as described in detail with reference to Figs. 4A and 4B, the server 250 may first train an ML scoring model to determine predicted indications of user responses by determining, based on the input matrix 402, matrices P and Q of vector representations of users and items such that the elements of the output matrix 404, defined as PQ T , provide a close approximation of the elements of the input matrix 402. The output matrix 404 determined in this way: (a) for an item from the old portion 255 of digital items that previously did not have an indication of a user response, contains a predicted indication 408 of a user response; and (b) for items from the old portion 255 of digital items that had actual indications of user responses, such as the old digital item associated with the actual indication 406 of a user response, approximates such indications with the required accuracy.

[0193] Кроме того, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять распределение откликов для прогнозируемых указаний на пользовательские отклики, определенных оценивающей моделью ML, в старой части 255 цифровых элементов. Например, как описано выше, сервер 250 может определять (а) параметры распределения откликов, в числе прочего, такие как математическое ожидание, среднеквадратическое отклонение, коэффициент асимметрии и крутизна распределения откликов, и/или (б) графическое представление распределения. [0193] In addition, according to some non-limiting embodiments of the present technology, the server 250 may determine a response distribution for the predicted user response indications determined by the ML scoring model in the old portion 255 of the digital items. For example, as described above, the server 250 may determine (a) response distribution parameters, such as, among other things, the mathematical expectation, the standard deviation, the skewness coefficient, and the slope of the response distribution, and/or (b) a graphical representation of the distribution.

[0194] Кроме того, с использованием распределения откликов сервер 250 может определять параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов с целью его применения в отношении новой части 275 цифровых элементов. В частности, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов, такие как коэффициенты уравнений (2) и (4), так, чтобы указания на синтезированные пользовательские отклики, определенные таким образом, были распределены в новой части 275 цифровых элементов в соответствии с распределением откликов. [0194] In addition, using the distribution of responses, the server 250 can determine the parameters of the use stage for the algorithm for generating synthesized user responses for the purpose of applying it to the new part 275 of the digital elements. In particular, according to some non-limiting embodiments of the present technology, the server 250 can determine the parameters of the use stage for the algorithm for generating synthesized user responses, such as the coefficients of equations (2) and (4), so that the indications of the synthesized user responses determined in this way are distributed in the new part 275 of the digital elements in accordance with the distribution of responses.

[0195] С этой целью, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов на основе старой части 255 цифровых элементов. В частности, сервер 250 может обучать алгоритм формирования синтезированных пользовательских откликов так, чтобы с учетом конкретного подхода к выбору старых цифровых элементов из старой части 255 цифровых элементов алгоритм формирования синтезированных пользовательских откликов был способен: (а) определять для старого цифрового элемента, такого как элемент из множества 257 старых цифровых элементов, связанного со поставщиком 247 старых элементов, значение вероятности получения старым цифровым элементом, например, положительного пользовательского отклика; и (б) назначать на основе этого значения вероятности указание на синтезированный пользовательский отклик для старого цифрового элемента так, чтобы указания на синтезированные пользовательские отклики были распределены во множестве 257 старых цифровых элементов согласно распределению откликов, как это описано выше. [0195] For this purpose, according to some non-limiting embodiments of the present technology, the server 250 may train an algorithm for generating synthesized user responses based on the old portion 255 of digital items. In particular, the server 250 may train the algorithm for generating synthesized user responses so that, given a particular approach to selecting old digital items from the old portion 255 of digital items, the algorithm for generating synthesized user responses is capable of: (a) determining, for an old digital item, such as an item from the set 257 of old digital items associated with the provider 247 of old items, a value of the probability of the old digital item receiving, for example, a positive user response; and (b) assigning, based on this probability value, an indication of a synthesized user response for the old digital item so that the indications of the synthesized user responses are distributed in the set 257 of old digital items according to a distribution of responses as described above.

[0196] Например, сервер 250 может назначать указание на синтезированный пользовательский отклик для старого цифрового элемента на основе значения вероятности, связанного с ним, и заранее заданных верхнего и нижнего порогов вероятности, как это описано выше. [0196] For example, server 250 may assign an indication of a synthesized user response for an old digital item based on a probability value associated therewith and predetermined upper and lower probability thresholds, as described above.

[0197] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, поскольку признаки элемента для новой части 275 цифровых элементов могут быть недоступными, сервер 250 может определять другие признаки для старой части 255 цифровых элементов с целью обучения алгоритма формирования синтезированных пользовательских откликов, как это также описано выше. В частности, для старого цифрового элемента из старой части 255 цифровых элементов сервер 250 может определять: (а) оценку сходства поставщика 247 старых элементов этого старого цифрового элемента относительно других поставщиков из множества 245 старых поставщиков старых элементов и (б) значение параметра популярности. [0197] According to some non-limiting embodiments of the present technology, since the features of the item for the new portion 275 of the digital items may not be available, the server 250 may determine other features for the old portion 255 of the digital items for the purpose of training the algorithm for generating synthesized user responses, as also described above. In particular, for an old digital item from the old portion 255 of the digital items, the server 250 may determine: (a) an assessment of the similarity of the supplier 247 of the old items of this old digital item relative to other suppliers from the plurality 245 of old suppliers of old items and (b) a value of the popularity parameter.

[0198] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может определять оценку сходства, связанную со поставщиком 247 старых элементов, на графе 500 сходства поставщиков элементов, как подробно описано со ссылкой на фиг. 5. Как описано выше, сервер 250 может определять значение параметра популярности, связанного со старым цифровым элементом, на основе данных из источников вне рекомендательной онлайн-платформы 260. [0198] According to some non-limiting embodiments of the present technology, the server 250 may determine a similarity score associated with the old item provider 247 in the item provider similarity graph 500, as described in detail with reference to Fig. 5. As described above, the server 250 may determine a popularity parameter value associated with the old digital item based on data from sources outside the online recommendation platform 260.

[0199] Кроме того, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять значение вероятности получения старым цифровым элементом указания на положительный пользовательский отклик на основе (а) первого значения вероятности, определенного на основе оценки сходства, связанной со поставщиком 247 старых элементов, согласно уравнению (2), и/или (б) второго значения вероятности, определенного на основе значения параметра популярности, связанного со старым цифровым элементом, согласно уравнению (4). [0199] In addition, in some non-limiting embodiments of the present technology, the server 250 may determine a probability value of the old digital item receiving an indication of a positive user response based on (a) a first probability value determined based on a similarity score associated with the old item provider 247 according to equation (2), and/or (b) a second probability value determined based on a popularity parameter value associated with the old digital item according to equation (4).

[0200] Кроме того, сервер 250 может определять коэффициенты a, b, c и d уравнений (2) и (4), которые представляют собой параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов, с использованием распределения откликов для прогнозируемых указаний на пользовательские отклики в старой части 255 цифровых элементов в качестве фактических данных. Как подробно описано выше, с этой целью, согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, сервер 250 может: (а) инициализировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов, например, случайным образом; (б) итеративно выполнять алгоритм формирования синтезированных пользовательских откликов, выбирая различные элементы из старой части 255 цифровых элементов; (в) после заранее заданного количества итераций выполнения алгоритма формирования синтезированных пользовательских откликов определять обучающее распределение синтезированных откликов для определенных таким образом указаний на синтезированные пользовательские отклики в старой части 255 цифровых элементов; и (г) корректировать параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы обучающее распределение синтезированных откликов с требуемой точностью соответствовало распределению откликов для прогнозируемых указаний на пользовательские отклики, определенных оценивающей моделью ML. [0200] In addition, the server 250 may determine the coefficients a, b, c and d of equations (2) and (4), which are the parameters of the use stage for the algorithm for generating synthesized user responses, using the distribution of responses for the predicted indications of user responses in the old portion 255 of the digital items as actual data. As described in detail above, for this purpose, according to some non-limiting embodiments of the present technology, the server 250 may: (a) initialize the parameters of the use stage for the algorithm for generating synthesized user responses, for example, randomly; (b) iteratively execute the algorithm for generating synthesized user responses, selecting different items from the old portion 255 of the digital items; (c) after a predetermined number of iterations of executing the algorithm for generating synthesized user responses, determine a training distribution of synthesized responses for the thus determined indications of synthesized user responses in the old portion 255 of the digital items; and (d) adjust the parameters of the use stage for the algorithm for generating synthesized user responses such that the training distribution of the synthesized responses matches, with a required accuracy, the distribution of responses for the predicted user response indications determined by the ML scoring model.

[0201] Таким образом, сервер 250 может определять параметры этапа использования для алгоритма формирования синтезированных пользовательских откликов так, чтобы уравнения (2) и (4) были представлены уравнениями (5), которые в этом случае могут использоваться для определения указаний на синтезированные пользовательские отклики для каждого элемента из новой части 275 цифровых элементов. [0201] Thus, the server 250 may determine the parameters of the use stage for the algorithm for generating synthesized user responses such that equations (2) and (4) are represented by equations (5), which in this case may be used to determine the indications of synthesized user responses for each element of the new portion 275 of digital elements.

[0202] Далее первый способ 800 продолжается на шаге 806. [0202] The first method 800 then continues at step 806.

Шаг 806: получение сервером указания на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов, и применение сервером оценивающей модели ML в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов для определения указания на синтезированный пользовательский отклик для нового цифрового элемента.Step 806: receiving by the server an indication of a new item provider from a plurality of new item providers who has uploaded a plurality of new digital items from a new part of digital items to the online recommendation platform, and applying by the server an ML evaluation model with respect to the new digital item from the plurality of new digital items of the new item provider to determine an indication of a synthesized user response for the new digital item.

[0203] Согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии, на шаге 806 сервер 250 может получать от множества 265 поставщиков новых элементов новую часть 275 цифровых элементов и применять в их отношении алгоритм формирования синтезированных пользовательских откликов с параметрами, определенными на шаге 804. [0203] According to some non-limiting embodiments of the present technology, at step 806, the server 250 may receive from a plurality 265 suppliers of new items a new portion 275 of digital items and apply to them an algorithm for generating synthesized user responses with the parameters determined at step 804.

[0204] С этой целью сервер 250 может: (а) определять для нового цифрового элемента первое и/или второе значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик согласно уравнениям (5); (б) на основе первого и/или второго значений вероятности этапа использования определять значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик; и (в) на основе значения вероятности этапа использования определять указание на отрицательный или положительный синтезированный пользовательский отклик, как это описано выше применительно к обучению алгоритма формирования синтезированных пользовательских откликов. [0204] For this purpose, the server 250 may: (a) determine for the new digital item a first and/or second value of the probability of the usage stage for the new digital item to receive an indication of a positive user response according to equations (5); (b) based on the first and/or second values of the probability of the usage stage, determine a value of the probability of the usage stage for the new digital item to receive an indication of a positive user response; and (c) based on the value of the probability of the usage stage, determine an indication of a negative or positive synthesized user response, as described above in relation to training the algorithm for generating synthesized user responses.

[0205] Подобно тому, как описано выше, сервер 250 может определять первое значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик на основе оценки сходства этапа использования для поставщика 267 новых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять оценку сходства этапа использования, связанную с поставщиком 267 новых элементов, на основе графа сходства поставщиков элементов этапа использования, сформированного подобно графу 500 сходства поставщиков элементов, но на основе значений параметров сходства множеств 245, 265 поставщиков старых и новых элементов, полученных от оценщиков-людей, как это подробно описано со ссылкой на фиг. 6. Определив оценку сходства этапа использования, сервер 250 с использованием уравнений (5) может определять первое значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик. [0205] Similar to what is described above, the server 250 may determine a first value of the usage stage probability for the new digital item to receive an indication of a positive user response based on a usage stage similarity score for the new item provider 267. In some non-limiting embodiments of the present technology, the server 250 may determine a usage stage similarity score associated with the new item provider 267 based on a usage stage item provider similarity graph formed similar to the item provider similarity graph 500, but based on the similarity parameter values of the sets 245, 265 of old and new item providers received from human raters, as described in detail with reference to FIG. 6. Having determined the usage stage similarity score, the server 250 may determine a first value of the usage stage probability for the new digital item to receive an indication of a positive user response using equations (5).

[0206] Кроме того, сервер 250 может (а) определять для нового цифрового элемента значение параметра популярности этапа использования и (б) путем применения уравнений (5) в отношении значения параметра популярности этапа использования определять второе значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик. [0206] In addition, the server 250 may (a) determine for the new digital item a usage stage popularity parameter value and (b) by applying equations (5) with respect to the usage stage popularity parameter value, determine a second usage stage probability value for the new digital item to receive an indication of a positive user response.

[0207] Кроме того, как это также описано выше, на основе первого и/или второго значений вероятности этапа использования сервер 250 может определять значение вероятности этапа использования для получения новым цифровым элементом указания на положительный пользовательский отклик, на основе которого сервер 250 может определять указание на синтезированный пользовательский отклик для нового цифрового элемента. [0207] In addition, as also described above, based on the first and/or second values of the probability of the stage of use, the server 250 can determine a value of the probability of the stage of use for receiving an indication of a positive user response by the new digital item, based on which the server 250 can determine an indication of a synthesized user response for the new digital item.

[0208] Соответственно, путем итеративного выполнения алгоритма формирования синтезированных пользовательских откликов для заранее заданного количества итераций и выбора на каждой итерации другого нового цифрового элемента из новой части 275 цифровых элементов, как это описано выше применительно к старой части 255 цифровых элементов, сервер 250 может формировать указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов. [0208] Accordingly, by iteratively executing the algorithm for generating synthesized user responses for a predetermined number of iterations and selecting at each iteration a different new digital element from the new portion 275 of digital elements, as described above in relation to the old portion 255 of digital elements, the server 250 can generate an indication of a synthesized user response for each element from the new portion 275 of digital elements.

[0209] Далее первый способ 800 переходит к шагу 808. [0209] Next, the first method 800 proceeds to step 808.

Шаг 808: формирование сервером обучающего набора данных, содержащего множество обучающих цифровых объектов, каждый из которых содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик.Step 808: generating by the server a training data set containing a plurality of training digital objects, each of which contains (a) one of a plurality of new digital elements of a supplier of new elements and (b) an indication of a synthesized user response.

[0210] Определив указание на синтезированный пользовательский отклик для каждого элемента из новой части 275 цифровых элементов, на шаге 808 сервер 250 может использовать новую часть 275 цифровых элементов с определенными таким образом указаниями на синтезированные пользовательские отклики с целью формирования нового обучающего набора данных, содержащего множество новых обучающих цифровых объектов, каждый из которых содержит по меньшей мере (а) указание на новый цифровой элемент из новой части 275 цифровых элементов и (б) по меньшей мере одно указание на синтезированный пользовательский отклик, определенное как это описано выше.[0210] Having determined an indication of a synthesized user response for each element from the new portion 275 of digital elements, in step 808 the server 250 may use the new portion 275 of digital elements with the thus determined indications of the synthesized user responses for the purpose of forming a new training data set comprising a plurality of new training digital objects, each of which comprises at least (a) an indication of a new digital element from the new portion 275 of digital elements and (b) at least one indication of a synthesized user response determined as described above.

[0211] Далее первый способ 800 продолжается на шаге 810. [0211] The first method 800 then continues at step 810.

Шаг 810: ввод сервером множества обучающих цифровых объектов в алгоритм MLA для обучения алгоритма MLA формированию рекомендаций цифровых элементов.Step 810: inputting a plurality of training digital objects into the MLA algorithm by the server to train the MLA algorithm to generate recommendations of digital items.

[0212] На шаге 810 сервер 250 может на основе множества новых цифровых элементов обучать алгоритм 280 MLA определению набора 225 рекомендуемых цифровых элементов, как это описано выше. В частности, сервер 250 может на основе множества новых обучающих цифровых объектов обучать алгоритм 280 MLA определению значения вероятности положительного действия пользователя 220 с новым цифровым элементом и на основе этого значения вероятности определять из числа других элементов из старой и новой частей 255, 275 цифровых элементов набор рекомендуемых цифровых элементов, пример которого подробно описан выше со ссылкой на фиг. 7. [0212] In step 810, the server 250 may, based on the plurality of new digital items, train the MLA algorithm 280 to determine the set 225 of recommended digital items, as described above. In particular, the server 250 may, based on the plurality of new training digital objects, train the MLA algorithm 280 to determine the probability value of a positive action by the user 220 with the new digital item and, based on this probability value, determine a set of recommended digital items from among other items from the old and new parts 255, 275 of digital items, an example of which is described in detail above with reference to Fig. 7.

[0213] На этом выполнение первого способа 800 завершается. [0213] This completes the execution of the first method 800.

Второй способThe second way

[0214] Описанные выше архитектура и примеры позволяют выполнять другой способ формирования обучающего набора данных для обучения алгоритма 280 MLA формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы 260. На фиг. 9 представлена блок-схема второго способа 900 согласно некоторым не имеющим ограничительного характера вариантам осуществления настоящей технологии. Способ 900 также может выполняться сервером 250. [0214] The architecture and examples described above allow for another method of generating a training data set for training the MLA algorithm 280 to generate recommendations of digital items for users of the online recommendation platform 260. Fig. 9 shows a flow chart of a second method 900 according to some non-limiting embodiments of the present technology. The method 900 can also be performed by the server 250.

[0215] Подобно описанному выше первому способу 800, второй способ 900 предназначен для формирования обучающего набора данных для обучения алгоритма MLA путем формирования указаний на синтезированные пользовательские отклики для новой части 275 цифровых элементов, не имеющих указаний на фактические пользовательские отклики от пользователей рекомендательной онлайн-платформы 260.[0215] Similar to the first method 800 described above, the second method 900 is designed to generate a training data set for training the MLA algorithm by generating indications of synthesized user responses for a new portion 275 of digital items that do not have indications of actual user responses from users of the online recommendation platform 260.

Шаг 902: получение сервером указания на поставщика новых элементов, имеющего множество новых цифровых элементов, подлежащих загрузке на рекомендательную онлайн-платформу и не имеющих полученных ранее пользовательских откликов.Step 902: receiving an indication by the server of a new item provider that has a plurality of new digital items to be uploaded to the online recommendation platform and that have no previously received user responses.

[0216] Второй способ 900 начинается с шага 902, на котором сервер 250 может получать указание на поставщика 267 новых элементов, загрузившего множество 277 новых цифровых элементов на рекомендательную онлайн-платформу 260, как это описано выше. [0216] The second method 900 begins with step 902, in which the server 250 may receive an indication of a provider 267 of new items that has uploaded a plurality 277 of new digital items to the online recommendation platform 260, as described above.

[0217] Далее второй способ 900 продолжается на шаге 904. [0217] The second method 900 then continues at step 904.

Шаг 904: получение сервером указания на множество поставщиков старых элементов, загрузивших множество старых цифровых элементов, по меньшей мере некоторые из которых получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы.Step 904: receiving by the server an indication of a plurality of legacy item providers that have uploaded a plurality of legacy digital items, at least some of which have received a user response from at least one user of the online recommendation platform.

[0218] На шаге 904 сервер 250 может получать указание на множество 245 поставщиков старых элементов рекомендательной онлайн-платформы 260, где по меньшей мере некоторые старые цифровые элементы имеют по меньшей мере одно фактическое указание на пользовательский отклик. [0218] At step 904, the server 250 may receive an indication of a plurality 245 of providers of old elements of the online recommendation platform 260, where at least some of the old digital elements have at least one actual indication of a user response.

[0219] Далее второй способ 900 продолжается на шаге 906. [0219] The second method 900 then continues at step 906.

Шаг 906: анализ сервером поставщика новых элементов и множества поставщиков старых элементов с целью определения эталонного поставщика старых элементов на основе параметра сходства поставщика новых элементов с каждым из множества поставщиков старых элементов.Step 906: analyzing the new item provider and the plurality of old item providers by the server to determine a reference old item provider based on a similarity parameter of the new item provider with each of the plurality of old item providers.

[0220] На шаге 906 сервер 250 может определять среди множества 245 поставщиков старых элементов эталонного поставщика старых элементов для поставщика 267 новых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять эталонного поставщика старых элементов как поставщика из множества 245 поставщиков старых элементов, наиболее схожего с поставщиком 267 новых элементов. Например, в этих вариантах осуществления изобретения сервер 250 может определять поставщика из множества 245 поставщиков старых элементов, наиболее схожего с поставщиком 267 новых элементов, на основе меток оценщиков-людей, как это описано выше со ссылкой на фиг. 6. [0220] In step 906, the server 250 may determine, among the plurality 245 suppliers of old items, a reference supplier of old items for the supplier 267 of new items. In some non-limiting embodiments of the present technology, the server 250 may determine the reference supplier of old items as the supplier from the plurality 245 suppliers of old items that is most similar to the supplier 267 of new items. For example, in these embodiments of the invention, the server 250 may determine the supplier from the plurality 245 suppliers of old items that is most similar to the supplier 267 of new items based on the labels of the human raters, as described above with reference to FIG. 6.

[0221] При этом в других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять эталонного поставщика старых элементов для поставщика 267 новых элементов как наиболее популярного поставщика из множества 245 поставщиков старых элементов, как это описано выше со ссылкой на фиг. 5. [0221] In other non-limiting embodiments of the present technology, the server 250 may determine the reference supplier of old items for the supplier 267 of new items as the most popular supplier from the plurality 245 suppliers of old items, as described above with reference to Fig. 5.

[0222] Далее второй способ 900 продолжается на шаге 908. [0222] The second method 900 then continues at step 908.

Шаг 908: определение сервером распределения откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов.Step 908: determining, by the server, a distribution of responses for indications of user responses in the plurality of legacy digital items associated with the reference legacy item provider.

[0223] На шаге 908 сервер 250 может определять локальное распределение откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять локальное распределение откликов лишь для фактических указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может определять локальное распределение откликов для прогнозируемых указаний на пользовательские отклики во множестве старых цифровых элементов, определенных оценивающей моделью ML, как это описано выше. [0223] In step 908, the server 250 may determine a local distribution of responses for user response indications in the plurality of old digital items associated with the reference provider of old items. In some non-limiting embodiments of the present technology, the server 250 may determine a local distribution of responses only for actual user response indications in the plurality of old digital items associated with the reference provider of old items. In other non-limiting embodiments of the present technology, the server 250 may determine a local distribution of responses for predicted user response indications in the plurality of old digital items determined by the ML scoring model, as described above.

[0224] На способ определения сервером 250 локального распределения откликов не накладывается ограничений. Он может включать в себя любые подходы, описанные выше применительно к распределению откликов. [0224] There is no limitation on the method by which the server 250 determines the local distribution of responses. It may include any of the approaches described above in relation to the distribution of responses.

[0225] Далее второй способ переходит к шагу 910. [0225] The second method then proceeds to step 910.

Шаг 910: назначение сервером указаний на синтезированные пользовательские отклики множеству новых цифровых элементов поставщика новых элементов согласно распределению откликов для указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов. Step 910: assigning, by the server, indications of the synthesized user responses to the plurality of new digital items of the new item provider according to the distribution of responses for indications of the user responses in the plurality of old digital items of the reference old item provider.

[0226] На шаге 910 сервер 250 может назначать указания на синтезированные пользовательские отклики множеству 277 новых цифровых элементов поставщика 267 новых элементов согласно локальному распределению откликов для указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов. [0226] At step 910, the server 250 may assign indications of the synthesized user responses to the set 277 new digital items of the provider 267 new items according to a local distribution of responses for indications of the user responses in the set of old digital items of the reference provider of old items.

[0227] Например, можно предположить, что множество старых цифровых элементов эталонного поставщика старых элементов содержит пять старых цифровых элементов с указаниями на положительный или отрицательный пользовательский отклик, распределенными в нем следующим образом: [100/25; 108000/580; 9995874/36954; 135001/398; 127/24]. Таким образом, с использованием этого локального распределения откликов сервер 250 может назначать указания на синтезированные пользовательские отклики для множества 277 новых цифровых элементов так, чтобы минимизировать различия между параметрами, такими как математическое ожидание и среднеквадратическое отклонение, для локального распределения откликов и для сформированного таким образом распределения указаний на синтезированный пользовательский отклик во множестве 277 новых цифровых элементов (описано выше). Таким образом, если множество 277 новых цифровых элементов также содержит пять цифровых элементов, то сервер 250 может определять для него указания на синтезированные пользовательские отклики, совпадающие с локальным распределением откликов из описанного выше примера. Можно сказать, что в результате сервер 250 имитирует локальное распределение откликов для указаний на пользовательские отклики во множестве старых цифровых элементов с целью формирования указаний на синтезированные пользовательские отклики для каждого элемента из множества 277 новых цифровых элементов. [0227] For example, it can be assumed that the set of old digital elements of the reference supplier of old elements contains five old digital elements with indications of a positive or negative user response distributed therein as follows: [100/25; 108000/580; 9995874/36954; 135001/398; 127/24]. Thus, using this local distribution of responses, the server 250 can assign indications of synthesized user responses to the set 277 of new digital elements so as to minimize the differences between parameters, such as the mathematical expectation and the standard deviation, for the local distribution of responses and for the thus formed distribution of indications of a synthesized user response in the set 277 of new digital elements (described above). Thus, if the set 277 of new digital elements also contains five digital elements, then the server 250 can determine for it indications of synthesized user responses that coincide with the local distribution of responses from the example described above. As a result, it can be said that the server 250 simulates the local distribution of responses for indications of user responses in the set of old digital elements in order to generate indications of synthesized user responses for each element of the set 277 of new digital elements.

[0228] Далее второй способ 900 продолжается на шагах 912 и 914, реализованных подобно шагам 808 и 810, соответственно, первого способа 800. [0228] The second method 900 then continues at steps 912 and 914, which are implemented similarly to steps 808 and 810, respectively, of the first method 800.

[0229] На этом выполнение второго способа 900 завершается. [0229] This completes the execution of the second method 900.

[0230] Обучив алгоритм 280 MLA на основе нового обучающего набора данных, сформированного согласно первому или второму способам 800, 900, сервер 250 может представлять пользователю 220 по меньшей мере некоторые элементы из новой части 275 цифровых элементов в качестве части набора 225 рекомендуемых цифровых элементов. [0230] After training the MLA algorithm 280 based on the new training data set generated according to the first or second methods 800, 900, the server 250 may present to the user 220 at least some items from the new portion 275 of digital items as part of the set 225 of recommended digital items.

[0231] После представления пользователю 220 нового цифрового элемента из новой части 275 цифровых элементов путем назначения для него указания на синтезированный пользовательский отклик, как это описано выше, сервер 250 может получить указание на пользовательский отклик от пользователя 220. Если указание на пользовательский отклик от пользователя 220 отличается от указания на синтезированный пользовательский отклик, сервер 250 может заменить последнее на первое. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 250 может добавлять указание на пользовательский отклик от пользователя 220 к сформированному таким образом указанию на синтезированный пользовательский отклик.[0231] After presenting a new digital item from the new portion 275 of digital items to the user 220 by assigning an indication of a synthesized user response to it, as described above, the server 250 may receive an indication of a user response from the user 220. If the indication of a user response from the user 220 differs from the indication of a synthesized user response, the server 250 may replace the latter with the former. In other non-limiting embodiments of the present technology, the server 250 may add an indication of a user response from the user 220 to the indication of a synthesized user response thus generated.

[0232] Таким образом, некоторые не имеющие ограничительного характера варианты осуществления настоящей технологии позволяют представлять новые цифровые элементы пользователям рекомендательной онлайн-платформы 260 при наличии ограниченных данных об этих новых цифровых элементах, что может способствовать повышению удовлетворенности пользователей и множества поставщиков новых элементов. [0232] Thus, some non-limiting embodiments of the present technology allow new digital items to be presented to users of the online recommendation platform 260 with limited data about these new digital items, which may contribute to increased satisfaction of users and a plurality of providers of new items.

[0233] Для специалиста в данной области могут быть очевидными возможные изменения и усовершенствования описанных выше вариантов осуществления настоящей технологии. Предшествующее описание приведено лишь в иллюстративных целях, а не для ограничения объема изобретения. Объем охраны настоящей технологии определяется исключительно объемом приложенной формулы изобретения.[0233] Possible changes and improvements to the above-described embodiments of the present technology may be obvious to a person skilled in the art. The preceding description is provided for illustrative purposes only and is not intended to limit the scope of the invention. The scope of protection of the present technology is determined solely by the scope of the appended claims.

[0234] Несмотря на то, что описанные выше варианты реализации приведены со ссылкой на конкретные шаги, выполняемые в определенном порядке, должно быть понятно, что эти шаги могут быть объединены, разделены или что их порядок может быть изменен без выхода за границы настоящей технологии. Соответственно, порядок и группировка шагов не носят ограничительного характера для настоящей технологии. [0234] Although the embodiments described above are described with reference to specific steps performed in a particular order, it should be understood that these steps may be combined, separated, or that their order may be changed without departing from the scope of the present technology. Accordingly, the order and grouping of the steps are not limiting to the present technology.

Claims (60)

1. Способ формирования обучающего набора данных для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, имеющей множество цифровых элементов, содержащее: 1. A method for forming a training data set for training a machine learning algorithm to form recommendations of digital elements for users of an online recommendation platform that has a plurality of digital elements, containing: (1) старую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу одним из множества поставщиков старых элементов, при этом по меньшей мере некоторые старые цифровые элементы из старой части цифровых элементов получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы, а указания на пользовательские отклики по меньшей мере некоторых старых цифровых элементов распределены в старой части цифровых элементов согласно распределению откликов; и (1) an old portion of digital items, each of which was uploaded to the online recommendation platform by one of a plurality of old item providers, wherein at least some of the old digital items in the old portion of digital items have received a user response from at least one user of the online recommendation platform, and indications of the user responses of at least some of the old digital items are distributed in the old portion of digital items according to the distribution of responses; and (2) новую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу поставщиком новых элементов из множества поставщиков новых элементов и не имеет пользовательского отклика, (2) a new portion of digital items, each of which was uploaded to the online recommendation platform by a new item provider from a plurality of new item providers and has no user feedback, при этом формирование предполагает формирование синтезированных пользовательских откликов для новых цифровых элементов, а способ выполняется сервером, на котором размещена рекомендательная онлайн-платформа, и включает в себя:in this case, the formation involves the formation of synthesized user responses for new digital elements, and the method is performed by the server on which the online recommendation platform is located, and includes: - на первом этапе - обучение сервером оценивающей модели машинного обучения определению прогнозируемого указания на пользовательский отклик для цифрового элемента, включающее в себя:- at the first stage - training the server of the machine learning evaluation model to determine the predicted indication of the user response for a digital element, including: - получение сервером указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом; и- receiving by the server indications of the old portion of digital elements for the purpose of forming a plurality of training digital objects for assessment, each of which contains (a) the old digital element from the old portion of digital elements and (b) an indication of the user response received by the old digital element; and - ввод сервером множества цифровых объектов для оценивания в оценивающую модель машинного обучения и обучение таким образом оценивающей модели машинного обучения определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных;- inputting by the server a plurality of digital objects for evaluation into an evaluation machine learning model and thereby training the evaluation machine learning model to determine a predicted user response indication for the digital item using the response distribution for user response indications in the old portion of the digital items as actual data; - на втором этапе, следующем за первым этапом:- at the second stage, following the first stage: - получение сервером указания на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов; - receiving by the server an indication of a supplier of new elements from a plurality of suppliers of new elements who has uploaded a plurality of new digital elements from a new part of digital elements to the online recommendation platform; - применение сервером оценивающей модели машинного обучения в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента; - applying by the server an evaluation machine learning model in relation to a new digital item from a plurality of new digital items of a supplier of new items in order to determine an indication of a synthesized user response for the new digital item; - формирование сервером обучающего набора данных, содержащего множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и- the formation by the server of a training data set containing a plurality of training digital objects, wherein the training digital object contains (a) one of a plurality of new digital elements of the supplier of new elements and (b) an indication of a synthesized user response; and - ввод сервером множества обучающих цифровых объектов в алгоритм машинного обучения для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов. - input by the server of a set of training digital objects into the machine learning algorithm to train the machine learning algorithm to generate recommendations of digital elements. 2. Способ по п. 1, отличающийся тем, что применение оценивающей модели машинного обучения включает в себя определение первого значения вероятности получения указания на положительный пользовательский отклик новым цифровым элементом поставщика новых цифровых элементов, при этом определение основано на оценке сходства поставщика новых элементов со множеством поставщиков старых элементов. 2. The method according to claim 1, characterized in that the use of the machine learning evaluation model includes determining a first value of the probability of receiving an indication of a positive user response by a new digital element of a supplier of new digital elements, wherein the determination is based on an assessment of the similarity of the supplier of new elements with a set of suppliers of old elements. 3. Способ по п. 2, отличающийся тем, что первое значение вероятности определяется по формуле: 3. The method according to paragraph 2, characterized in that the first probability value is determined by the formula: , , где artistScore - оценка сходства поставщика новых элементов со множеством поставщиков старых элементов, a и b - коэффициенты, определенные путем обучения оценивающей модели машинного обучения. where artistScore is the similarity score of the new item supplier to the set of old item suppliers, a and b are coefficients determined by training the machine learning scoring model. 4. Способ по п. 2, отличающийся тем, что он дополнительно включает в себя определение сервером оценки сходства поставщика новых элементов со множеством поставщиков старых элементов. 4. The method according to paragraph 2, characterized in that it additionally includes determining by the server an assessment of the similarity of the supplier of new elements with a set of suppliers of old elements. 5. Способ по п. 4, отличающийся тем, что определение оценки сходства поставщика новых элементов включает в себя: 5. The method according to paragraph 4, characterized in that determining the similarity assessment of the supplier of new elements includes: - получение для поставщика старых элементов из множества поставщиков старых элементов значения параметра сходства поставщика старых элементов с поставщиком новых элементов;- obtaining for the supplier of old elements from the set of suppliers of old elements the value of the similarity parameter of the supplier of old elements with the supplier of new elements; - формирование сервером на основе значений параметра сходства каждого поставщика из множества поставщиков старых элементов с поставщиком новых элементов ориентированной графовой структуры, в которой вершина ориентированной графовой структуры представляет поставщика элементов из множества поставщиков старых элементов или из множества поставщиков новых элементов, а ребро, соединяющее пару вершин, представляет ненулевое значение параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов; - the formation by the server, based on the values of the similarity parameter of each supplier from the set of suppliers of old elements with the supplier of new elements, of an oriented graph structure, in which a vertex of the oriented graph structure represents a supplier of elements from the set of suppliers of old elements or from the set of suppliers of new elements, and an edge connecting a pair of vertices represents a non-zero value of the similarity parameter of the supplier of new elements with one of the set of suppliers of old elements; - определение сервером для ребра весового значения, указывающего на значение параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов; и- determining by the server for the edge a weight value indicating the value of the similarity parameter of the supplier of new elements with one of the plurality of suppliers of old elements; and - определение сервером оценки сходства поставщика новых элементов как максимального суммарного весового значения при переходе от вершины ориентированной графовой структуры, связанной с поставщиком новых элементов, к ее начальной вершине. - determination by the server of the similarity score of the supplier of new elements as the maximum total weight value when moving from the vertex of the directed graph structure associated with the supplier of new elements to its initial vertex. 6. Способ по п. 5, отличающийся тем, что определение весового значения включает в себя определение обратного значения для значения параметра сходства поставщика новых элементов с одним из множества поставщиков старых элементов. 6. The method according to paragraph 5, characterized in that determining the weight value includes determining the inverse value for the value of the similarity parameter of the supplier of new elements with one of the plurality of suppliers of old elements. 7. Способ по п. 5, отличающийся тем, что параметр сходства представляет собой степень сходства поставщика новых элементов с каждым из множества поставщиков старых элементов. 7. The method according to claim 5, characterized in that the similarity parameter represents the degree of similarity of the supplier of new elements with each of the plurality of suppliers of old elements. 8. Способ по п. 7, отличающийся тем, что он дополнительно включает в себя получение от оценщика-человека степени сходства поставщика новых элементов с каждым из множества поставщиков старых элементов. 8. The method according to claim 7, characterized in that it additionally includes obtaining from a human evaluator the degree of similarity of the supplier of new elements with each of the plurality of suppliers of old elements. 9. Способ по п. 2, отличающийся тем, что применение оценивающей модели машинного обучения дополнительно включает в себя определение второго значения вероятности получения указания на положительный пользовательский отклик новым цифровым элементом поставщика новых цифровых элементов, при этом определение основано на значении популярности нового цифрового элемента в данной области. 9. The method according to claim 2, characterized in that the use of the machine learning evaluation model additionally includes determining a second value of the probability of receiving an indication of a positive user response by a new digital element of a supplier of new digital elements, wherein the determination is based on the value of the popularity of the new digital element in a given area. 10. Способ по п. 9, отличающийся тем, что второе значение вероятности определяется по формуле: 10. The method according to paragraph 9, characterized in that the second probability value is determined by the formula: , , где Popularity - значение популярности нового цифрового элемента в данной области, maxPopularity - значение популярности наиболее популярного в данной области нового цифрового элемента из соответствующего множества цифровых элементов поставщика новых элементов, minPopularity - значение популярности наименее популярного в данной области нового цифрового элемента из соответствующего множества цифровых элементов поставщика новых элементов, c и d - коэффициенты, определенные путем обучения оценивающей модели машинного обучения. where Popularity is the popularity value of a new digital element in a given area, maxPopularity is the popularity value of the most popular new digital element in a given area from the corresponding set of digital elements of the supplier of new elements, minPopularity is the popularity value of the least popular new digital element in a given area from the corresponding set of digital elements of the supplier of new elements, c and d are coefficients determined by training the evaluating machine learning model. 11. Способ по п. 9, отличающийся тем, что новый цифровой элемент представляет собой аудиопоток, а значение популярности нового цифрового элемента указывает на по меньшей мере одно из следующего: (а) количество потоков аудиопотока на медиа-ресурсе; (б) количество запросов на воспроизведение аудиопотока на медиа-ресурсе; (в) позиция аудиопотока в хит-параде; (г) количество проданных альбомов, содержащих аудиопоток. 11. The method according to claim 9, characterized in that the new digital element is an audio stream, and the popularity value of the new digital element indicates at least one of the following: (a) the number of streams of the audio stream on the media resource; (b) the number of requests to play the audio stream on the media resource; (c) the position of the audio stream in the hit parade; (d) the number of albums sold containing the audio stream. 12. Способ по п. 9, отличающийся тем, что он дополнительно включает в себя: 12. The method according to paragraph 9, characterized in that it additionally includes: - назначение сервером новому цифровому элементу указания на положительный синтезированный пользовательский отклик, если первое и/или второе значение вероятности больше верхнего порога вероятности; и - assigning by the server to the new digital element an indication of a positive synthesized user response if the first and/or second probability value is greater than the upper probability threshold; and - назначение сервером новому цифровому элементу указания на отрицательный синтезированный пользовательский отклик, если первое и/или второе значение вероятности меньше нижнего порога вероятности, который меньше верхнего порога вероятности. - assigning by the server to the new digital element an indication of a negative synthesized user response if the first and/or second probability value is less than the lower probability threshold, which is less than the upper probability threshold. 13. Способ по п. 12, отличающийся тем, что перед применением оценивающей модели машинного обучения он дополнительно включает в себя выбор сервером нового цифрового элемента из множества новых цифровых элементов. 13. The method according to claim 12, characterized in that before applying the machine learning evaluation model, it additionally includes the server selecting a new digital element from a plurality of new digital elements. 14. Способ по п. 13, отличающийся тем, что выбор включает в себя выбор нового цифрового элемента из множества новых цифровых элементов одним из следующих способов: (а) случайным образом; (б) с использованием равномерных вероятностей выбора; (в) с использованием значения вероятности выбора, пропорционального значению популярности нового цифрового элемента в данной области; и (г) с использованием значения вероятности выбора, пропорционального квадратному корню из значения популярности нового цифрового элемента в данной области. 14. The method according to claim 13, characterized in that the selection includes selecting a new digital element from a plurality of new digital elements in one of the following ways: (a) randomly; (b) using uniform selection probabilities; (c) using a selection probability value proportional to the popularity value of the new digital element in the given area; and (d) using a selection probability value proportional to the square root of the popularity value of the new digital element in the given area. 15. Способ по п. 13, отличающийся тем, что выбор и применение выполняются итеративно в течение заранее заданного количества итераций перед формированием обучающего набора данных. 15. The method according to claim 13, characterized in that the selection and application are performed iteratively over a predetermined number of iterations before forming the training data set. 16. Способ по п. 1, отличающийся тем, что он дополнительно включает в себя обновление сервером обучающего цифрового объекта из множества обучающих цифровых объектов путем замены в нем указания на синтезированный пользовательский отклик указанием на пользовательский отклик, если сервер определил, что новый цифровой элемент из множества новых цифровых элементов получил пользовательский отклик. 16. The method according to claim 1, characterized in that it additionally includes updating by the server the training digital object from the plurality of training digital objects by replacing in it the indication of the synthesized user response with an indication of the user response, if the server has determined that a new digital element from the plurality of new digital elements has received a user response. 17. Способ по п. 1, отличающийся тем, что оценивающая модель машинного обучения представляет собой модель машинного обучения матричной факторизации. 17. The method according to claim 1, characterized in that the evaluating machine learning model is a matrix factorization machine learning model. 18. Способ по п. 1, отличающийся тем, что алгоритм машинного обучения представляет собой алгоритм машинного обучения на основе деревьев решений, алгоритм машинного обучения на основе трансформера или алгоритм машинного обучения на основе глубокого семантического сходства. 18. The method according to claim 1, characterized in that the machine learning algorithm is a machine learning algorithm based on decision trees, a machine learning algorithm based on a transformer, or a machine learning algorithm based on deep semantic similarity. 19. Способ формирования обучающего набора данных для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, имеющей множество цифровых элементов, при этом формирование предполагает формирование синтезированных пользовательских откликов для новых цифровых элементов, а способ выполняется сервером, на котором размещена рекомендательная онлайн-платформа, и включает в себя:19. A method for forming a training data set for training a machine learning algorithm to form recommendations of digital elements for users of an online recommendation platform that has a plurality of digital elements, wherein the formation involves the formation of synthesized user responses for new digital elements, and the method is performed by a server on which the online recommendation platform is hosted, and includes: - получение сервером указания на поставщика новых элементов из числа поставщиков новых элементов, имеющего множество новых цифровых элементов, подлежащих загрузке на рекомендательную онлайн-платформу, при этом новый цифровой элемент из множества новых цифровых элементов не имеет полученного ранее пользовательского отклика; - receiving by the server an indication of a supplier of new elements from among suppliers of new elements, having a plurality of new digital elements subject to uploading to the online recommendation platform, wherein the new digital element from the plurality of new digital elements does not have a previously received user response; - получение сервером указания на множество поставщиков старых элементов, загрузивших множество старых цифровых элементов, по меньшей мере некоторые из которых получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы;- receiving by the server an indication of a plurality of legacy item providers that have uploaded a plurality of legacy digital items, at least some of which have received a user response from at least one user of the online recommendation platform; - анализ сервером поставщика новых элементов и множества поставщиков старых элементов с целью определения эталонного поставщика старых элементов на основе параметра сходства поставщика новых элементов с каждым из множества поставщиков старых элементов;- analysis by the server of the supplier of new elements and the set of suppliers of old elements in order to determine the reference supplier of old elements based on the similarity parameter of the supplier of new elements with each of the set of suppliers of old elements; - определение сервером синтезированных пользовательских откликов для множества новых цифровых элементов поставщика новых элементов на основе пользовательских откликов, полученных множеством старых цифровых элементов эталонного поставщика старых элементов, включающее в себя: - determining by the server synthesized user responses for a plurality of new digital elements of a supplier of new elements based on user responses received by a plurality of old digital elements of a reference supplier of old elements, including: - определение сервером распределения откликов для указаний на пользовательские отклики во множестве старых цифровых элементов, связанных с эталонным поставщиком старых элементов; - determining by the server a distribution of responses for indications of user responses in a set of legacy digital items associated with a reference legacy item provider; - назначение сервером указаний на синтезированные пользовательские отклики множеству новых цифровых элементов поставщика новых элементов согласно распределению откликов для указаний на пользовательские отклики во множестве старых цифровых элементов эталонного поставщика старых элементов; - assignment by the server of indications of synthesized user responses to a set of new digital elements of a supplier of new elements according to the distribution of responses for indications of user responses in a set of old digital elements of a reference supplier of old elements; - формирование сервером обучающего набора данных, содержащего множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и- the formation by the server of a training data set containing a plurality of training digital objects, wherein the training digital object contains (a) one of a plurality of new digital elements of the supplier of new elements and (b) an indication of a synthesized user response; and - ввод сервером множества обучающих цифровых объектов в алгоритм машинного обучения для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов. - input by the server of a set of training digital objects into the machine learning algorithm to train the machine learning algorithm to generate recommendations of digital elements. 20. Сервер для формирования обучающего набора данных для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов для пользователей рекомендательной онлайн-платформы, размещенной на сервере и имеющей множество цифровых элементов, содержащее: 20. A server for generating a training data set for training a machine learning algorithm to generate recommendations of digital elements for users of an online recommendation platform located on the server and having a plurality of digital elements, containing: (1) старую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу одним из множества поставщиков старых элементов, при этом по меньшей мере некоторые старые цифровые элементы из старой части цифровых элементов получили пользовательский отклик от по меньшей мере одного пользователя рекомендательной онлайн-платформы, а указания на пользовательские отклики по меньшей мере некоторых старых цифровых элементов распределены в старой части цифровых элементов согласно распределению откликов; и (1) an old portion of digital items, each of which was uploaded to the online recommendation platform by one of a plurality of old item providers, wherein at least some of the old digital items in the old portion of digital items have received a user response from at least one user of the online recommendation platform, and indications of the user responses of at least some of the old digital items are distributed in the old portion of digital items according to the distribution of responses; and (2) новую часть цифровых элементов, каждый из которых был загружен на рекомендательную онлайн-платформу поставщиком новых элементов из множества поставщиков новых элементов и не имеет пользовательского отклика, (2) a new portion of digital items, each of which was uploaded to the online recommendation platform by a new item provider from a plurality of new item providers and has no user feedback, при этом формирование предполагает формирование синтезированных пользовательских откликов для новых цифровых элементов, а сервер содержит машиночитаемую физическую память, хранящую команды, и процессор, способный при исполнении команд выполнять следующие действия: in this case, the formation involves the formation of synthesized user responses for new digital elements, and the server contains machine-readable physical memory that stores commands, and a processor capable of performing the following actions when executing commands: - на первом этапе - обучение оценивающей модели машинного обучения определению прогнозируемого указания на пользовательский отклик для цифрового элемента путем:- at the first stage - training the machine learning evaluation model to determine the predicted user response indication for a digital element by: - получения указаний на старую часть цифровых элементов с целью формирования множества обучающих цифровых объектов для оценивания, каждый из которых содержит (а) старый цифровой элемент из старой части цифровых элементов и (б) указание на пользовательский отклик, полученный старым цифровым элементом; и- receiving indications of an old portion of digital elements to form a plurality of training digital objects for assessment, each of which comprises (a) an old digital element from the old portion of digital elements and (b) an indication of a user response received by the old digital element; and - ввода множества цифровых объектов для оценивания в оценивающую модель машинного обучения и обучения таким образом оценивающей модели машинного обучения определению прогнозируемого указания на пользовательский отклик для цифрового элемента с использованием распределения откликов для указаний на пользовательские отклики в старой части цифровых элементов в качестве фактических данных;- inputting a plurality of digital objects for evaluation into a machine learning evaluation model and training the machine learning evaluation model to determine a predicted user response indication for the digital item using the response distribution for user response indications in the old portion of the digital items as actual data; - на втором этапе, следующем за первым этапом:- at the second stage, following the first stage: - получение указания на поставщика новых элементов из множества поставщиков новых элементов, загрузившего на рекомендательную онлайн-платформу множество новых цифровых элементов из новой части цифровых элементов; - receiving an indication of a supplier of new elements from a plurality of suppliers of new elements who has uploaded a plurality of new digital elements from a new part of digital elements to the online recommendation platform; - применение оценивающей модели машинного обучения в отношении нового цифрового элемента из множества новых цифровых элементов поставщика новых элементов с целью определения указания на синтезированный пользовательский отклик для нового цифрового элемента; - applying a machine learning evaluation model to a new digital item from a plurality of new digital items of a supplier of new items in order to determine an indication of a synthesized user response for the new digital item; - формирование обучающего набора данных, содержащего множество обучающих цифровых объектов, при этом обучающий цифровой объект содержит (а) один из множества новых цифровых элементов поставщика новых элементов и (б) указание на синтезированный пользовательский отклик; и- forming a training data set containing a plurality of training digital objects, wherein the training digital object contains (a) one of a plurality of new digital elements of a supplier of new elements and (b) an indication of a synthesized user response; and - ввод множества обучающих цифровых объектов в алгоритм машинного обучения для обучения алгоритма машинного обучения формированию рекомендаций цифровых элементов.- inputting a set of training digital objects into a machine learning algorithm to train the machine learning algorithm to generate recommendations for digital elements.
RU2022133953A 2022-12-22 2022-12-22 System and method for forming training data set for training machine learning algorithm RU2844072C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US18/394,988 US20240232709A1 (en) 2022-12-22 2023-12-22 System and a method of generating a training set of data for training a machine-learning algorithm

Publications (2)

Publication Number Publication Date
RU2022133953A RU2022133953A (en) 2024-09-06
RU2844072C2 true RU2844072C2 (en) 2025-07-25

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2693646C1 (en) * 2018-10-03 2019-07-03 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Method and system for selection of proposals for a user based on analysis of actions thereof
US20210064649A1 (en) * 2019-08-30 2021-03-04 Spotify Ab Systems and methods for providing content based on consumption in a distinct domain
CN113672803A (en) * 2021-08-02 2021-11-19 杭州网易云音乐科技有限公司 Recommended method, apparatus, computing device and storage medium
CN113742572A (en) * 2021-08-03 2021-12-03 杭州网易云音乐科技有限公司 Data recommendation method and device, electronic equipment and storage medium
CN113886695A (en) * 2021-09-30 2022-01-04 杭州网易云音乐科技有限公司 Resource recommendation method and device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2693646C1 (en) * 2018-10-03 2019-07-03 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Method and system for selection of proposals for a user based on analysis of actions thereof
US20210064649A1 (en) * 2019-08-30 2021-03-04 Spotify Ab Systems and methods for providing content based on consumption in a distinct domain
CN113672803A (en) * 2021-08-02 2021-11-19 杭州网易云音乐科技有限公司 Recommended method, apparatus, computing device and storage medium
CN113742572A (en) * 2021-08-03 2021-12-03 杭州网易云音乐科技有限公司 Data recommendation method and device, electronic equipment and storage medium
CN113886695A (en) * 2021-09-30 2022-01-04 杭州网易云音乐科技有限公司 Resource recommendation method and device

Similar Documents

Publication Publication Date Title
CN111291266B (en) Artificial intelligence based recommendation method and device, electronic equipment and storage medium
CN110717098B (en) Meta-path-based context-aware user modeling method and sequence recommendation method
CN110263244B (en) Content recommendation method, device, storage medium and computer equipment
CA3007853C (en) End-to-end deep collaborative filtering
US10339171B2 (en) Dynamic feedback in a recommendation system
US11989488B2 (en) Automatically and intelligently exploring design spaces
CN113515690B (en) Content recall model training method, content recall method, device and equipment
US10354184B1 (en) Joint modeling of user behavior
CN111966914A (en) Content recommendation method and device based on artificial intelligence and computer equipment
US20170061286A1 (en) Supervised Learning Based Recommendation System
CN110909182A (en) Multimedia resource searching method and device, computer equipment and storage medium
KR20250042826A (en) Identification of products in media items
JP7529344B2 (en) Method, system, and computer program for personalized recommendations based on topics of interest
CN114417058B (en) A method, apparatus, computer device, and storage medium for selecting video footage.
US20240378636A1 (en) Asset Audience Gap Recommendation and Insight
US20250316062A1 (en) Self-supervised audio-visual learning for correlating music and video
US20250307257A1 (en) Intuitive content search results suggestion system
KR20250048291A (en) Media Items and Product Pairing
US20220027776A1 (en) Content cold-start machine learning system
CN116521979A (en) Target object display method and device, electronic equipment and storage medium
RU2844072C2 (en) System and method for forming training data set for training machine learning algorithm
US12306886B2 (en) Method and a server for generating a machine learning model
CN115563317B (en) Multimedia content push method, device, equipment and storage medium
US20240232709A1 (en) System and a method of generating a training set of data for training a machine-learning algorithm
CN116975322A (en) Media data display methods, devices, computer equipment, storage media