[go: up one dir, main page]

RU2787308C1 - Spam disposal system - Google Patents

Spam disposal system Download PDF

Info

Publication number
RU2787308C1
RU2787308C1 RU2021124532A RU2021124532A RU2787308C1 RU 2787308 C1 RU2787308 C1 RU 2787308C1 RU 2021124532 A RU2021124532 A RU 2021124532A RU 2021124532 A RU2021124532 A RU 2021124532A RU 2787308 C1 RU2787308 C1 RU 2787308C1
Authority
RU
Russia
Prior art keywords
spam
information
database
messages
processed information
Prior art date
Application number
RU2021124532A
Other languages
Russian (ru)
Inventor
Алексей Анатольевич Гришин
Алексей Владимирович Жирнов
Александр Викторович Шафров
Original Assignee
Общество с ограниченной ответственностью "Компания СПЕКТР"
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Компания СПЕКТР" filed Critical Общество с ограниченной ответственностью "Компания СПЕКТР"
Application granted granted Critical
Publication of RU2787308C1 publication Critical patent/RU2787308C1/en

Links

Images

Abstract

FIELD: computer protection.
SUBSTANCE: invention relates to the field of computer protection; it can be used for extraction of information useful to an end user from an array of digital data, including spam intended for deletion. The method contains stages of: reception of messages from spam folders; storage of unprocessed messages to at least one database of unprocessed messages; analysis, by means of at least one spam processing module, of text and service information of each spam message in the database of unprocessed messages in accordance with a given criterion for clustering spam according to the given criterion; extraction of useful information from the formed cluster; antivirus check for prevention of infection by means of an antivirus protection unit and a database with information about infected messages; storage of processed information obtained as a result of the above-mentioned processing in a database of processed information, where the database of processed information is associated with at least one mentioned spam processing module; and provision of a user with the results of processing through the module for provision of processed information associated with at least one mentioned database of processed information.
EFFECT: provision of protection of a user’s computing device from spam messages, while simultaneously extracting data from an array of digital data classified as spam.
1 cl, 3 dwg

Description

Изобретение относится к решениям по извлечению полезной для конечного потребителя информации из массива цифровых данных, в том числе спама, предназначенного к удалению.The invention relates to solutions for extracting information useful to the end user from an array of digital data, including spam, intended to be deleted.

Рассмотрим определение понятия «спам».Consider the definition of spam.

Википедия дает следующее определение понятия «спам»: «Спам (англ. spam) - массовая рассылка корреспонденции рекламного характера лицам, не выражавшим желания ее получить, а также рассылка массовых сообщений».Wikipedia gives the following definition of "spam": "Spam (English spam) - mass mailing of advertising correspondence to persons who did not express a desire to receive it, as well as mass mailing."

Согласно определению «Лаборатории Касперского», «Спам — это анонимная массовая непрошенная рассылка».According to Kaspersky Lab's definition, "Spam is anonymous mass unsolicited mail."

Как можно увидеть, ни в одном из определений не сказано, что спам представляет из себя что-то, не заслуживающее внимания. Но текущая практика работы со спамом устроена так, что весь спам проходит мимо внимания как конечного пользователя, так и возможных лиц, ответственных за работу получателя спама (руководители корпоративного пользователя). А именно, текущая практика подразумевает сохранение спама в отдельном хранилище, которое находится за пределами основного внимания конечного пользователя, хранение спама в этом хранилище какое-то непродолжительное время (например, «Google Gmail» – 30 дней, «Яндекс почта» - 10 дней), и удаление спама без возможности последующего восстановления.As you can see, none of the definitions says that spam is something that does not deserve attention. But the current practice of working with spam is arranged in such a way that all spam passes by the attention of both the end user and the possible persons responsible for the work of the spam recipient (heads of the corporate user). Namely, the current practice involves storing spam in a separate repository that is outside the main attention of the end user, storing spam in this repository for some short time (for example, "Google Gmail" - 30 days, "Yandex Mail" - 10 days) , and deleting spam without the possibility of subsequent recovery.

При этом статистика показывает, что спам составляет подавляющее большинство всего информационного потока в настоящее время. Например, согласно данным “Лаборатории Касперского”, в начале 2011-го года доля спама в совокупном объеме трафика электронной почты составляла почти 80% [https://web.archive.org/web/20120724031934/http:/www.computery.ru/news/news2010.php?nid=8302]. Последние данные, которыми мы обладаем, показывают, что на второй квартал 2019 года доля спама по-прежнему составляет более половины совокупного трафика [https://securelist.ru/spam-and-phishing-in-q2-2019/94529/].At the same time, statistics show that spam makes up the vast majority of the entire information flow at the present time. For example, according to Kaspersky Lab data, at the beginning of 2011, the share of spam in the total volume of email traffic was almost 80% [https://web.archive.org/web/20120724031934/http:/www.computery.ru /news/news2010.php?nid=8302]. The latest data we have shows that spam still accounts for more than half of total traffic as of Q2 2019 [https://securelist.ru/spam-and-phishing-in-q2-2019/94529/].

Как результат, можно констатировать, что более половины информационного потока сообщений (со всеми затратами на пересылку, хранение, обработку и т.д.) удаляется, не принося никакой пользы никому.As a result, it can be stated that more than half of the information flow of messages (with all the costs of forwarding, storing, processing, etc.) is deleted without bringing any benefit to anyone.

Предложение (суть системы утилизации спама) состоит в том, чтобы собирать спам получателей с согласия их, либо, лиц, имеющих право дать такое согласие за получателя (руководство в случае корпоративных получателей) и извлекать из этих сообщений информацию, которая может быть полезна конечным потребителям сервиса.The proposal (the essence of the spam disposal system) is to collect spam from recipients with the consent of them, or persons with the right to give such consent for the recipient (guidance in the case of corporate recipients) and extract information from these messages that may be useful to end users service.

Актуальность спама.The relevance of spam.

Актуальность проблемы спама сегодня ни у кого не вызывает сомнений. Достаточно лишь привести цифру, что более половины всех электронных писем, поступающих в корпоративные сети, являются спамом в том или ином виде. Потери от спама, которые несут корпоративные пользователи, значительны и по некоторым оценкам исчисляются десятками тысяч долларов за счет потери рабочего времени и использовании сетевых ресурсов.The urgency of the problem of spam today no one doubts. Suffice it to cite the figure that more than half of all e-mails entering corporate networks are spam in one form or another. Spam losses incurred by corporate users are significant and, according to some estimates, amount to tens of thousands of dollars due to the loss of working time and the use of network resources.

Рассылаемое при спаме сообщение, в зависимости от целей и задач отправителя (спаммера), может содержать коммерческую информацию, а может не иметь отношения к коммерческой деятельности. По содержанию сообщения выделяют «коммерческий» спам — unsolicited commercial e-mail (общепринятая аббревиатура — UCE) и «некоммерческий» — unsolicited bulk e-mail (UBE).The message sent during spam, depending on the goals and objectives of the sender (spammer), may contain commercial information, or may not be related to commercial activities. According to the content of the message, "commercial" spam is distinguished - unsolicited commercial e-mail (common abbreviation - UCE) and "non-commercial" - unsolicited bulk e-mail (UBE).

С точки зрения организации текста электронного письма последнее может содержать в поле Subject информацию о том, что оно из себя представляет (например, что оно содержит рекламную информацию), а в теле письма — указание причины, по которой отправитель счел нужным обратиться к получателю. Как правило, в нем содержатся сведения и о том, какие действия должен предпринять получатель, чтобы в дальнейшем не получать сообщений от отправителя.From the point of view of organizing the text of an e-mail, the latter may contain in the Subject field information about what it is (for example, that it contains advertising information), and in the body of the letter - an indication of the reason why the sender considered it necessary to contact the recipient. As a rule, it contains information about what actions the recipient must take in order not to receive messages from the sender in the future.

Указанные признаки свидетельствуют о том, что отправитель понимает – предлагаемая им информация навязывается получателям, и добросовестно пытается снизить возможное негативное воздействие. Однако очень часто спаммер не только не испытывает желания снизить дискомфорт своих адресатов, но и отказывается от ответственности за свои действия путем фальсификации адреса отправителя, использования адреса третьего лица и фальсификации заголовков сообщения. Делается все это для того, чтобы максимально затруднить установление личности отправителя и принятие соответствующих мер.These signs indicate that the sender understands that the information he offers is being imposed on the recipients, and is conscientiously trying to reduce the possible negative impact. However, very often the spammer is not only unwilling to reduce the discomfort of his recipients, but also refuses responsibility for his actions by falsifying the sender's address, using the address of a third party, and falsifying message headers. All this is done in order to make it as difficult as possible to identify the sender and take appropriate measures.

Проблема спама.Spam problem.

Следует отличать спам от легальных почтовых рассылок, которые, хотя и во многом повторяют многие черты спама, являются запрошенными пользователем и должны доставляться ему. Spam should be distinguished from legitimate mailing lists, which, although they share many of the features of spam, are requested by the user and should be delivered to him.

Пагубность таких рассылок (спама) заключается в том, что спамеру это практически ничего не стоит, зато они дорого обходятся всем остальным, к примеру, получателю спама или его провайдеру. Большое количество рекламной корреспонденции может привести к излишней нагрузке на каналы и почтовые серверы провайдера, из-за чего обычная почта, которую, возможно, очень ждут получатели, будет проходить значительно медленнее. За все расплачивается получатель спама, оплачивающий своему провайдеру время в Сети, затрачиваемое на получение незапрошенной корреспонденции с почтового сервера. The perniciousness of such mailings (spam) lies in the fact that it costs the spammer practically nothing, but they are expensive for everyone else, for example, the spam recipient or its provider. A large amount of promotional mail can lead to excessive load on the channels and mail servers of the provider, which is why regular mail, which recipients may be waiting for, will be much slower. The recipient of the spam pays for everything, paying their ISP for time on the Web to receive unsolicited mail from the mail server.

Кроме непосредственных затрат, отделение непрошеной информации от нужной и ее удаление требует временных затрат, что также очень неудобно, особенно для активных людей – у них на это нередко уходит много времени. К тому же, спам зачастую используется совместно с различными вирусными технологиями.In addition to direct costs, separating unsolicited information from the necessary and deleting it requires time, which is also very inconvenient, especially for active people - it often takes them a lot of time. In addition, spam is often used in conjunction with various virus technologies.

Причина появления спама заключается в том, что это - экономически эффективное средство маркетинга, несмотря на крайне низкий процент откликов на него. Ведь его эффективность рассчитывается не по абсолютному числу откликов, а по соотношению результата к затратам. А затраты на массовые рассылки минимальны. Следовательно, спам эффективен даже при очень низком результате.The reason for spam is that it is a cost-effective marketing tool, despite its extremely low response rate. After all, its effectiveness is calculated not by the absolute number of responses, but by the ratio of results to costs. And the cost of mass mailings is minimal. Therefore, spamming is effective even at a very low score.

Спамерский бизнес становится все более прибыльным и привлекает все больше клиентов. Последних подкупает возможность за небольшие деньги разнести свою рекламу по миллионам адресов. По информации из открытых источников в среднем рассылка обходится в сумму от $20-50 (100 тыс. адресам) до $500 (несколько миллионов адресов. Несколько сот тысяч сообщений можно разослать в течение одной ночи. Как утверждают спамеры, отклик на такую рекламу - минимум один из тысячи адресатов, что очень много для миллионных рассылок. А затраты минимальны.The spam business is becoming more and more profitable and attracting more and more customers. The latter are captivated by the opportunity to spread their advertising to millions of addresses for little money. According to information from open sources, on average, mailing costs from $20-50 (100 thousand addresses) to $500 (several million addresses. Several hundred thousand messages can be sent out in one night. According to spammers, the response to such advertising is at least one out of a thousand recipients, which is a lot for mailings of millions, and the costs are minimal.

К тому же спамеру, начинающему свой бизнес, нет нужды вкладывать большие деньги - он может обойтись несколькими сотнями долларов, необходимыми для оплаты широкополосного доступа в Интернет. Правда, серьезные спамерские конторы подходят к делу гораздо серьезнее. Они содержат штат квалифицированных программистов, специалистов в области лингвистики и т. д.In addition, a spammer starting his business does not need to invest a lot of money - he can get by with the several hundred dollars needed to pay for broadband Internet access. True, serious spammers take the matter much more seriously. They contain a staff of qualified programmers, linguistic specialists, etc.

Невероятная живучесть спама обусловлена практически нулевой стоимостью его рассылки. Ведь для ведения спам-рассылок только и требуется, что компьютер и доступ в Интернет. Одному человеку вполне по силам ежедневно рассылать до нескольких миллионов писем. Все затраты на рассылку рекламы в итоге ложатся на ее получателей. Именно в этом главное отличие спама от обычной почтовой рекламы.The incredible survivability of spam is due to the almost zero cost of sending it. After all, to conduct spam mailings, all you need is a computer and Internet access. One person is quite capable of sending out up to several million letters daily. All advertising costs are ultimately borne by its recipients. This is the main difference between spam and regular email advertising.

Однако от спамерских атак практически не защищены почтовые серверы провайдеров (если у них, конечно, не установлен специальный фильтр). Если в корпоративной сети можно строго настроить пропуск входящей информации, то провайдер должен по умолчанию принимать все сообщения.However, mail servers of providers are practically not protected from spam attacks (unless, of course, they have a special filter installed). If the corporate network can be strictly configured to allow incoming information, then the provider should accept all messages by default.

Способы борьбы со спамом.Ways to fight spam.

Для пользователя спам – это временные затраты по разборке почтового мусора. Для провайдера - еще и потерянные деньги. В частности, они вынуждены оплачивать дополнительный трафик, который создают спамеры, а также антиспам-фильтры и работу персонала по настройке фильтров и по разбору жалоб пользователей.For the user, spam is the time spent on sorting out mail garbage. For the provider - also lost money. In particular, they are forced to pay for additional traffic generated by spammers, as well as anti-spam filters and the work of staff to set up filters and resolve user complaints.

Интернет-сообщество пытается бороться со спамом.The Internet community is trying to fight spam.

Последнее время постоянно предлагаются различные способы борьбы со спамом. Эти способы можно условно разделить на следующие категории: Recently, various methods of combating spam have been constantly proposed. These methods can be divided into the following categories:

- Юридические способы (законодательная база).- Legal methods (legislative framework).

- Технические способы (фильтрация спама на почтовом сервере или клиенте, либо другие технологические способы).- Technical methods (spam filtering on the mail server or client, or other technological methods).

В настоящее время используется несколько технологических способов борьбы со спамом, но не все они достаточно эффективны. Currently, several technological methods are used to combat spam, but not all of them are sufficiently effective.

В первую очередь, это "черные списки" и автоматические фильтры. First of all, these are "black lists" and automatic filters.

"Черные списки" помимо того, что в последнее время практически потеряли свою актуальность из-за всевозможных ухищрений спамеров по подстановке адресов и захвату пользовательских машин, зачастую достаточно агрессивны и могут содержать адреса провайдеров, сеть которых использовалась для рассылки писем или даже для хостинга сайтов, отрекламированных массовой рассылкой. "Blacklists" in addition to the fact that recently they have practically lost their relevance due to all sorts of tricks of spammers to substitute addresses and capture user machines, they are often quite aggressive and may contain addresses of providers whose network was used to send letters or even host sites, advertised by mass mailing.

Автоматические фильтры, осуществляющие поиск по заданным терминам (словам и словосочетаниям), в сочетании с другими методами в состоянии подавить до 95% непрошенной корреспонденции. Впрочем, спамеры постоянно обходят эти барьеры, вставляя орфографические ошибки и другие малые изменения в темы и тексты писем. Так, очень часто письма, которые приходят к нам от отечественных спамеров, содержат латинские буквы, которые заменяют собой похожие на них русские, в частности - "И" и "U", "В", "T" и т. д. Все это делается для того, чтобы обмануть фильтры. Automatic filters that search for specified terms (words and phrases), in combination with other methods, are able to suppress up to 95% of unsolicited correspondence. However, spammers routinely get around these barriers by inserting spelling errors and other minor changes to email subject lines and body text. So, very often letters that come to us from domestic spammers contain Latin letters that replace Russian ones similar to them, in particular - "I" and "U", "B", "T", etc. All this is done in order to fool the filters.

Для защиты адресов на HTML-страницах рекомендуется использовать кодирование адреса. В самом деле, в современных браузерах существует множество возможностей для такого способа. Это и использование HTML-кодирования, когда буква "A", например, заменяется ее кодом (т.е. A). Для осуществления кодирования существует много специальных программ.To protect addresses in HTML pages, it is recommended to use address encoding. Indeed, in modern browsers there are many possibilities for this method. This and the use of HTML encoding, when the letter "A", for example, is replaced by its code (ie A). There are many special programs for encoding.

Так же, как несколько лет назад, многие почтовые сервера установили антивирусные фильтры, в последнее время крупные порталы (yandex.ru, mail.ru) начинают использовать антиспамовые фильтры.Just like a few years ago, many mail servers have installed anti-virus filters, recently large portals (yandex.ru, mail.ru) are starting to use anti-spam filters.

Сейчас разрабатываются новые схемы, более эффективные способы защиты, применяющие интеллектуальный анализ текста и графики. Но они достаточно дороги - по некоторым данным, стоимость такого ПО составляет обычно от $0,25 до $2 за один почтовый адрес у провайдера. Таким образом, интернет-компании средней руки защита обойдется в несколько тысяч долларов.Now new schemes are being developed, more effective methods of protection that use intellectual analysis of text and graphics. But they are quite expensive - according to some reports, the cost of such software is usually from $0.25 to $2 for one mailing address from the provider. Thus, for a medium-sized Internet company, protection will cost several thousand dollars.

Западные провайдеры используют и жесткие меры по отношению к спамерам. К примеру, в ноябре прошлого года скандинавский оператор TeliaSonera начал отключать от сети пользователей, рассылающих спам. Недавно крупный американский провайдер кабельного Интернета, Comcast, пригрозил своим пользователям отключением, если те не очистят свои компьютеры от осевших на них троянских программ, занимающихся рассылкой спама. При этом американский провайдер уже пытался бороться с такой напастью, но попытки установить спам-фильтр привели к массовой блокировке писем, отправляемых в Россию, и практику пришлось отменить.Western providers also use harsh measures against spammers. For example, in November last year, the Scandinavian operator TeliaSonera began disconnecting spam users from the network. Recently, a major US cable Internet provider, Comcast, threatened its users with shutdowns if they didn't clean their computers of spamming Trojans that had landed on them. At the same time, the American provider has already tried to deal with such a scourge, but attempts to install a spam filter led to a massive blocking of letters sent to Russia, and the practice had to be canceled.

Законодательные мерыLegislative measures

Надо отметить, на Западе борьба со спамом вышла на законодательный уровень лишь недавно. В Евросоюзе принят соответствующий закон, который должен быть адаптирован в законодательства входящих в него стран - понятно, что это процесс достаточно длительный. It should be noted that in the West the fight against spam has reached the legislative level only recently. The European Union has adopted a corresponding law, which must be adapted to the legislation of its member countries - it is clear that this process is quite lengthy.

На территории США 1 января 2004 года вступил в силу федеральный "антиспамовый" закон, а также соответствующие законодательные акты в штатах. Интересно, что в каждом штате существует различная степень ответственности за спам. В штате Мэриленд приняли закон, предусматривающий наказание в виде лишения свободы на срок до пяти лет за рассылку спама с использованием мошеннических методов.In the United States, on January 1, 2004, the federal "anti-spam" law came into force, as well as relevant state laws. Interestingly, each state has a different degree of liability for spam. The state of Maryland passed a law providing for penalties of up to five years in prison for sending spam using fraudulent methods.

В России тоже происходят подвижки. Уже существует несколько ассоциаций, которые ставят своей целью легальное противодействие спаму. Например, в 2003 году была организована "Национальная коалиция против спама", основанная российским представительством Microsoft, компаниями Rambler, Mail.ru. "Голден Телеком", Subscribe.ru, "Лаборатория Касперского и "Ашманов и Партнеры" (сейчас Коалиция включает 15 компаний).There are also shifts in Russia. There are already several associations that aim to legally counter spam. For example, in 2003, the "National Coalition against Spam" was organized, founded by the Russian representative office of Microsoft, Rambler, Mail.ru companies. Golden Telecom, Subscribe.ru, Kaspersky Lab and Ashmanov & Partners (now the Coalition includes 15 companies).

Создатели коалиции намерены разработать общие технологические средства и стандарты для фильтрации непрошенных писем, выработать стандарты для легальных рекламных рассылок и подготовить законодательную базу для борьбы с этим явлением.The creators of the coalition intend to develop common technological tools and standards for filtering unsolicited letters, develop standards for legitimate advertising mailings and prepare a legislative framework to combat this phenomenon.

Однако борьба спамеров и антиспамовых фильтров все больше и больше напоминает противостояние вирусов и антивирусов, которое, вероятно, никогда не прекратится. Спамеры придумывают все новые и новые трюки. Даже в, казалось бы, надежной системе фильтрации по содержимому письма, спамеры нашли много лазеек. В Рунете все началось с использования похожих по начертанию букв. Если Вы не видите разницы между латинской буквой T и русской Т, то для спам-фильтров это два совершенно разных символа. Множество лазеек оставляют HTML-письма. Можно, например, между буквами текста вставить буквы одинакового с фоном цвета. Вы увидите на этом месте только небольшой пропуск, а программа-фильтр это слово не распознает.However, the struggle between spammers and anti-spam filters is becoming more and more like a confrontation between viruses and antiviruses, which will probably never stop. Spammers come up with more and more tricks. Even in the seemingly reliable system of filtering by the content of the letter, spammers have found many loopholes. In Runet, it all started with the use of similar letters. If you do not see the difference between the Latin letter T and the Russian T, then for spam filters these are two completely different characters. Many loopholes leave HTML letters. You can, for example, insert letters of the same color as the background between the letters of the text. You will see only a small gap in this place, and the filter program does not recognize this word.

По данным компаний, занимающихся вопросами сетевой безопасности, пользователи электронной почты сами поддерживают спамеров: около трети обладателей электронных почтовых ящиков переходили по ссылкам в спамерских сообщениях несмотря на то, что переход по такой ссылке - прямой и, следовательно, самый короткий путь к заражению компьютера возможными вирусами и троянами, ворующими личную информацию.According to network security companies, email users themselves support spammers: about a third of email owners have followed links in spam messages, despite the fact that clicking on such a link is a direct and, therefore, the shortest way to infect a computer with possible viruses and trojans that steal personal information.

Кроме того, ответ на спамерское письмо - гарантия того, что в следующий раз ящик будут "бомбить" во сто раз активнее. Около 10% людей покупали товары, рекламируемые таким малопочетным образом. А это означает, что спамеры не зря трудятся. Антиспамовые фильтры - лишь частичное решение проблемы, считают специалисты. Главная проблема - в самих пользователях.In addition, the answer to a spam letter is a guarantee that the next time the box will be "bombed" a hundred times more actively. About 10% of people bought products advertised in such a dishonorable way. And this means that spammers are not working in vain. Anti-spam filters are only a partial solution to the problem, experts say. The main problem is in the users themselves.

Выводы и решаемые задачи:Conclusions and tasks to be solved:

- Проблема спама на сегодняшний день является серьезной для интернет-сообщества и связана со значительными затратами по ее устранению. Учитывая, что все предпринимаемые меры по борьбе со спамом встречают все более изощренное противодействие спамеров, направленных на обход фильтров и других методов борьбы со спамом, проблема спама будет актуальна ещё долгое время.- The problem of spam today is serious for the Internet community and is associated with significant costs to eliminate it. Considering that all measures taken to combat spam are met with increasingly sophisticated opposition from spammers aimed at bypassing filters and other methods of combating spam, the problem of spam will be relevant for a long time to come.

- Предлагаемый способ обработки (утилизации или переработки) спама предполагает не борьбу со спамом, которая зачастую напоминает сражение с ветряными мельницами, а извлечение полезной для конечного потребителя информации из массива цифровых данных, в том числе спама, предназначенных для удаления.- The proposed method for processing (utilizing or processing) spam does not involve fighting spam, which often resembles a battle with windmills, but extracting useful information for the end user from an array of digital data, including spam, intended for deletion.

- Весь объём спама можно систематизировать и извлечь оттуда полезную информацию, в соответствии с желанием потребителя, в самых разных разрезах: по тематике информации; по объёму информации; по возможной заинтересованной аудитории; по времени прихода спама; по адресатам и т.д.- The entire volume of spam can be systematized and useful information can be extracted from there, in accordance with the desire of the consumer, in a variety of ways: by the subject of information; by the amount of information; by possible interested audience; by the time of arrival of spam; by addressees, etc.

- Выводы, которые следуют из подобного анализа, могут заинтересовать как потребителя спама (как руководство организации, получающей спам, так и отдельных физических лиц), так и отправителя спама (например, в сравнении тематик рассылаемых другими отправителями сообщений).- The conclusions that follow from such an analysis may be of interest to both the consumer of spam (both the management of the organization receiving spam and individual individuals) and the sender of spam (for example, in comparing the topics of messages sent by other senders).

- Информация может быть полезна корпоративным пользователям, интернет-провайдерам и другим участникам цифрового рынка. Следствием этого будет экономия на затратах по уничтожению спама, а в перспективе – при дальнейшем развитии метода «Утилизация спама» - превышение этих затрат и получение прибыли пользователем.- The information may be useful to corporate users, Internet service providers and other participants in the digital market. The consequence of this will be savings on the costs of destroying spam, and in the future - with the further development of the "Spam Disposal" method - exceeding these costs and making a profit by the user.

- Также спам можно условно разделить на доброкачественный и злокачественный. Доброкачественный – т.е. не несущий впоследствии вредоносного воздействия на потребителя. Злокачественный – имеющий своей возможной целью нанесение какого-либо ущерба потребителю (воздействие на информационные ресурсы потребителя, на психологию пользователей, на секретность коммерческой и технической информации, на морально-политические воззрения абонента и т.д.).- Also, spam can be conditionally divided into benign and malignant. Benign - i.e. not bearing subsequently harmful effects on the consumer. Malignant - having as its possible goal the infliction of any damage to the consumer (impact on the consumer's information resources, on the psychology of users, on the secrecy of commercial and technical information, on the moral and political views of the subscriber, etc.).

- Выводы, полученные в результате анализа спама, в дальнейшем могут быть использованы в качестве средства воздействия на персонал (как корпоративный, так и сторонний) либо в других целях по желанию выгодоприобретателя полученных выводов.- The conclusions obtained as a result of spam analysis can later be used as a means of influencing personnel (both corporate and third-party) or for other purposes at the request of the beneficiary of the received conclusions.

Анализ существующих патентов и заявок на выдачу патентов по теме обработки спама.Analysis of existing patents and patent applications on the topic of spam handling.

1. Заявка США № US20100082749A1.1. US Application No. US20100082749A1.

Наименование патента: RETROSPECTIVE SPAM FILTERING (РЕТРОСПЕКТИВНАЯ ФИЛЬТРАЦИЯ СПАМА).Patent name: RETROSPECTIVE SPAM FILTERING (RETROSPECTIVE SPAM FILTERING).

В документе №US20100082749A1 говорится о том, чтобы вернуть неправильно помеченную информацию «negative» в актуальную для пользователя информацию «positive» (блок 0004). Смысл повторной обработки в американском патенте – избежать неправильного помещения в спам, либо «вернуть» информацию из спама при «повторной» обработке. Document #US20100082749A1 talks about reverting mislabeled "negative" information to user-relevant "positive" information (block 0004). The point of reprocessing in the US patent is to avoid being misplaced in spam, or to "recover" information from spam when "re-processing".

Т.е. существует правило помещения в спам. Существует вариант, когда в спам информация попадает ошибочно. Затем могут быть изменены правила помещения в спам или изменены критерии оценки «спам-не спам». Для этого и предусмотрена повторная обработка информации, чтобы вернуть информацию в «positive», т.е. в актуальную для пользователя.Those. there is a spam rule. There is a variant when information gets into spam by mistake. The spam rules can then be changed, or the spam-not-spam scoring criteria can be changed. For this, re-processing of information is provided in order to return information to “positive”, i.e. up to date for the user.

Этот процесс связан просто с классификацией информацией «спам» - «не спам», и никак не связан с предлагаемой системой.This process is simply related to the classification of information "spam" - "not spam", and is in no way connected with the proposed system.

В предлагаемом техническом решении любая информация (и «positive» и «negative») – это «полезная» (useful) информация.In the proposed technical solution, any information (both “positive” and “negative”) is “useful” information.

Сущность системы обработки спама заключается в том, чтобы информацию в спаме после любого количества обработки и отсева типа «спам – не спам» (это информация «negative» в американском патенте) НЕ УДАЛЯТЬ, а ИСПОЛЬЗОВАТЬ дальше, извлекая из всего спама полезную информацию.The essence of the spam processing system is that after any amount of processing and elimination of the “spam - not spam” type (this is “negative” information in the US patent) DO NOT DELETE the information in spam, but USE it further, extracting useful information from all spam.

В дальнейшем извлечённая из спама полезная информация может быть востребована на "рынке спама".In the future, useful information extracted from spam may be in demand on the "spam market".

2. Заявка США № US2016028673A12. US Application No. US2016028673A1

Наименование патента: MULTI-TIERED ANTI-SPAMMING SYSTEMS AND METHODS (МНОГОУРОВНЕВЫЕ СИСТЕМЫ И МЕТОДЫ БОРЬБЫ СО СПАМОМ).Patent name: MULTI-TIERED ANTI-SPAMMING SYSTEMS AND METHODS

В данном источнике говорится об уменьшении объема спама для пользователя.This source talks about reducing the amount of spam for the user.

Также в тексте патента ни разу не встречаются слова «переработка» или «утилизация» («recycling» or «utilization»).Also, the words “recycling” or “utilization” are never found in the text of the patent.

3. Патент РФ № RU2710739C1.3. RF patent No. RU2710739C1.

Данное решение направлено на повышение точности обнаружения спама.This solution is aimed at improving the accuracy of spam detection.

Также в тексте патента ни разу не встречаются слова «переработка» или «утилизация».Also, the words “recycling” or “disposal” never occur in the text of the patent.

Таким образом, все перечисленные патентные документы содержат описание технических решений, направленных на повышение качества процесса определения спама, а не на работу с информацией, которая окончательно определена как спам.Thus, all of the listed patent documents contain a description of technical solutions aimed at improving the quality of the spam detection process, and not at working with information that is finally defined as spam.

Соответственно в уровне техники не выявлено аналогов предлагаемого технического решения, то есть технических решений того же назначения.Accordingly, no analogues of the proposed technical solution, that is, technical solutions of the same purpose, have been identified in the prior art.

При этом, техническим результатом заявленного решения является обеспечение защиты вычислительного устройства пользователя от спам-сообщений с одновременным извлечением данных из массива цифровых данных, отнесенных к категории спама.At the same time, the technical result of the claimed solution is to protect the user's computing device from spam messages while extracting data from an array of digital data classified as spam.

Сущность предлагаемого решения.The essence of the proposed solution.

В системе утилизации спама предлагается рассматривать «спам-кластеры» (или просто – кластеры).In the spam disposal system, it is proposed to consider "spam clusters" (or simply clusters).

Необходимо отметить, что все рассмотренные патентные документы предусматривают работу с одним сообщением.It should be noted that all considered patent documents provide for the operation with one message.

В системе утилизация спама используется вся совокупность сообщений конкретного пользователя, т.е. это работа с многочисленными сообщениями. Обрабатываться будет каждое сообщение, но как конечный результат интерес представляют многочисленные сообщения кластеры. The spam disposal system uses the entire set of messages of a particular user, i.e. it's a job with multiple messages. Each message will be processed, but as an end result, multiple message clusters are of interest.

Результатом этой работы будет группировка (кластер, объединение) сообщений, на основании которой будет строиться статистика и не только статистика. The result of this work will be a grouping (cluster, union) of messages, on the basis of which statistics and not only statistics will be built.

Возможно эти группировки (или объединения) просто продавать, или использовать в других способах «переработки».Perhaps these groupings (or associations) are simply sold, or used in other ways of "recycling".

Т.е. если брать все сообщения с одного домена (по конкретному адресу), получим новый объект, новую информацию – «спам-кластер» или просто «кластер».Those. if we take all messages from one domain (at a specific address), we get a new object, new information - a “spam cluster” or just a “cluster”.

«Кластеры» можно формировать по любым признакам, параметрам: по времени, по темам, адресам, территориям и т.д. (та самая «специфичность» модулей обработки спам-информации, упомянутая выше)."Clusters" can be formed according to any characteristics, parameters: by time, by topics, addresses, territories, etc. (the same “specificity” of spam information processing modules mentioned above).

При этом само отдельное сообщение не интересно. Интересно получить «кластер», который является новой информацией, при этом добавится список сообщений (если понадобится).In this case, the message itself is not interesting. It's interesting to get a "cluster" which is new information, adding a list of messages (if needed).

Таким образом, «кластер» является новым материальным объектом, который будет представлен в виде нового набора записей базы данных, хранящихся на сервере системы.Thus, the "cluster" is a new material object, which will be represented as a new set of database records stored on the system server.

«Кластеры» могут пересекаться между собой."Clusters" can intersect with each other.

Материальная часть (система) для реализации способа состоит из долгосрочного хранилища информации, представленного в виде стандартного одного (или более) сервера, содержащего, как минимум, две базы данных: базу необработанной информации, и базу обработанных результатов, представленную в виде «спам-кластеров».The material part (system) for implementing the method consists of a long-term information storage, presented in the form of a standard one (or more) server, containing at least two databases: a database of raw information, and a database of processed results, presented in the form of "spam clusters ".

Также система включает в себя сервер обработки информации с набором модулей обработки спам-информации. Каждый модуль имеет доступ к базе данных необработанной информации, получает данные из соответствующих таблиц этой базы, и на основании алгоритма, специфичного для этого модуля, создает «спам-кластер», которые программными средствами сохраняет в базе данных результатов обработки как «продукт» в виде новых записей в соответствующих таблицах этой базы данных. The system also includes an information processing server with a set of spam information processing modules. Each module has access to the database of raw information, receives data from the corresponding tables of this database, and, based on the algorithm specific to this module, creates a “spam cluster”, which is stored by software in the database of processing results as a “product” in the form new records in the corresponding tables of this database.

Еще одной частью системы является сервер предоставления клиентам результатов обработки. Этот сервер представлен в виде сервера приложений для получения клиентами «продукта» посредством запросов, отправляемых по сети интернет, или в виде сервера электронной почты для предоставления клиентам «продукта» посредством рассылки сообщений электронной почты.Another part of the system is the server providing processing results to clients. This server is in the form of an application server for obtaining a "product" by customers through requests sent over the Internet, or as an email server for providing customers with a "product" by sending e-mail messages.

Осуществление системы утилизации спама.Implementation of a spam disposal system.

Общий принцип реализации способа отражён на фиг. 1.The general principle of the implementation of the method is shown in Fig. 1.

Входящий спам 1 (после всех обработок, помеченный на удаление) воспринимается не как спам, не как информация, а как объект с потенциальной коммерческой стоимостью.Incoming spam 1 (after all processing, marked for deletion) is perceived not as spam, not as information, but as an object with potential commercial value.

Этот объект можно приобретать у пользователей, пользователи могут передавать его по договоренности. И этот объект, переработанный предлагаемой системой (процесс переработки – 2), приобретает новые потребительские свойства (кластеры 3). This object can be purchased from users, users can transfer it by agreement. And this object, processed by the proposed system (recycling process - 2), acquires new consumer properties (clusters 3).

По применимости способа извлечения информации из спама основные гипотезы таковы:According to the applicability of the method of extracting information from spam, the main hypotheses are as follows:

- группировка по времени – статистика для корпоративных пользователей;- grouping by time - statistics for corporate users;

- группировка по территориям – маркетинговая информация для фирм, проводящих маркетинговые исследования, возможно, для производителей определённых групп товаров;- grouping by territories - marketing information for firms conducting marketing research, possibly for manufacturers of certain groups of goods;

- группировка по всем возможным признакам – спамерам и компаниям, осуществляющим борьбу со спамом;- grouping by all possible signs - spammers and companies engaged in the fight against spam;

- сокращение издержек корпоративных пользователей, тратящих ресурсы на уничтожение спама (покупать у них спам или договариваться на передачу спама, выдавать в итоге нужную пользователю информацию, может быть даже по разрезам, исходя их запросов пользователей).- reducing the costs of corporate users who spend resources to destroy spam (buy spam from them or negotiate the transmission of spam, eventually giving out the information the user needs, maybe even by sections, based on their user requests).

- при получении спама от многочисленных различных клиентов возможно формирование “кластеров” по нескольким клиентам. В результате может формироваться аналитика (статистика), которая может быть интересна не только для конкретного клиента. Такая статистика, например, может группироваться по типам клиентов (производство, сервисные компании, учебные заведения, и т.п.)- when receiving spam from numerous different clients, it is possible to form “clusters” for several clients. As a result, analytics (statistics) can be formed, which may be of interest not only for a particular client. Such statistics, for example, can be grouped by types of customers (manufacturing, service companies, educational institutions, etc.)

На фигурах 2 и 3 представлен способ извлечения информации из спама на примере спама электронной почты. Подобная схема может быть применена к спаму любых видов сообщений, где осуществляется предварительная фильтрация спама и хранение его отдельно от остальных сообщений.Figures 2 and 3 show a method for extracting information from spam using email spam as an example. A similar scheme can be applied to spam of all types of messages, where spam is pre-filtered and stored separately from other messages.

На фиг.2 представлена первая часть системы (и первый этап реализации способа соответственно), заключающийся в получении спам-сообщений клиентов и сохранения этих сообщений в необработанном (неизменном) виде в базе данных. Сохранение необработанных сообщений преследует, как минимум, две цели:Figure 2 shows the first part of the system (and the first stage of the implementation of the method, respectively), which consists in receiving spam messages from customers and storing these messages in raw (unchanged) form in the database. Storing raw messages serves at least two purposes:

- возможность восстановления одного или нескольких сообщений по запросу пользователя (что может рассматриваться, как один из конечных вариантов использования сервиса);- the ability to restore one or more messages at the request of the user (which can be considered as one of the final options for using the service);

- возможность обработки сообщений новыми алгоритмами, которые могут появиться после получения сообщения в сервис.- the ability to process messages with new algorithms that may appear after receiving a message to the service.

Система включает модуль (систему) подключения к ящикам электронной почты и получения сообщений из спам-папки (1.1), связанных с одним и более провайдером услуг электронной почты (1.2), имеющих доступ к спам-хранилищам конечных клиентов (1.3), блок антивирусной защиты (1.4), базу данных с информацией о зараженных сообщениях (1.5 и 2.1), базу данных необработанных сообщений электронной почты (1.6 и 2.2), модули обработки сообщений (2.3), базу данных обработанной информации (2.4), модуль (систему) предоставления обработанной информации (2.5).The system includes a module (system) for connecting to email boxes and receiving messages from a spam folder (1.1) associated with one or more email service providers (1.2) that have access to spam storages of end customers (1.3), an anti-virus protection unit (1.4), a database with information about infected messages (1.5 and 2.1), a database of unprocessed email messages (1.6 and 2.2), message processing modules (2.3), a database of processed information (2.4), a module (system) for providing processed information (2.5).

Система подключения к ящикам электронной почты клиентов и получения сообщений из спам-папки (1.1) с заданной периодичностью (например, 1 раз в 24 часа) выполняет подключение к одному, либо нескольким провайдерам услуг электронной почты (1.2). Посредством функционала провайдера система получает все сообщения электронной почты из спам-хранилища конечных клиентов (1.3). После этого все полученные сообщения проходят этап антивирусной проверки (1.4) для предотвращения заражения сервиса. Функционал антивирусной проверки является продуктом третьей стороны. По результату антивирусной проверки сообщения, определенные как инфицированные вирусом, нигде не сохраняются. Максимально возможный безопасно полученный объем информации об инфицированных сообщениях сохраняется в отдельной базе данных сервиса (1.5). Копии сообщений, определенных как безопасные после антивирусной проверки, сохраняются в базе данных сервиса (1.6) (при этом, не уничтожая сообщений из ящиков клиентов).The system for connecting to clients' e-mail boxes and receiving messages from a spam folder (1.1) with a specified frequency (for example, once every 24 hours) connects to one or several e-mail service providers (1.2). Through the provider functionality, the system receives all e-mail messages from the spam storage of end customers (1.3). After that, all received messages go through the stage of anti-virus scanning (1.4) to prevent infection of the service. The antivirus check functionality is a third party product. As a result of an anti-virus scan, messages identified as infected with a virus are not saved anywhere. The maximum possible safely received amount of information about infected messages is stored in a separate service database (1.5). Copies of messages defined as safe after anti-virus scanning are stored in the service database (1.6) (without destroying messages from client mailboxes).

На втором этапе (фиг. 3) один, или более, модулей обработки сообщений (2.3) с заданной периодичностью получают из Базы данных с информацией о зараженных сообщениях (2.1) (представленной на фиг. 2 под номером (1.5)) и Базы данных необработанных сообщений (2.2) (представленной на фиг. 2 под номером (1.6)) необработанные ранее этим Модулем сообщения, и обрабатывают каждое из сообщений по заложенному в Модуле алгоритму с целью получения информации, специфичной для каждого Модуля. В процессе обработки обрабатываться может как текст сообщения, так и любая служебная информация сообщения. Новая информация, полученная в результате обработки, сохраняется в Базе данных обработанной информации (2.4). Новые Модули с новыми алгоритмами обработки информации могут со временем быть добавлены в сервис по мере его развития.At the second stage (Fig. 3), one or more message processing modules (2.3) are obtained at specified intervals from the Database with information about infected messages (2.1) (represented in Fig. 2 under the number (1.5)) and the Database of unprocessed messages (2.2) (represented in Fig. 2 under the number (1.6)) previously unprocessed by this Module messages, and process each of the messages according to the algorithm embedded in the Module in order to obtain information specific to each Module. During processing, both the text of the message and any service information of the message can be processed. New information obtained as a result of processing is stored in the Processed Information Database (2.4). New Modules with new information processing algorithms may eventually be added to the service as it develops.

Система предоставления итоговой информации (2.5) служит для предоставления конечным пользователям сервиса результатов обработки и требуемом виде (графики, сводные таблицы, отчеты и т.д.).The system for providing summary information (2.5) serves to provide the end users of the service with the results of processing in the required form (graphs, pivot tables, reports, etc.).

Описанную выше блок-схему можно проиллюстрировать на следующем примере.The block diagram described above can be illustrated by the following example.

Данные спам-сообщения поступают в сервис (в систему утилизации спама) посредством внешнего программного интерфейса в виде типизированного объекта, представляющего сообщение с набором всех свойств сообщения. Функционал доставки информации в сервис представляет из себя программу (либо различные программы), не являющиеся частью системы (сервиса). Условием функционирования данной программы (программ) является совместимость с интерфейсом доступа к сервису. Такая программа (программы) могут быть созданы сторонними разработчиками.Spam message data is received by the service (spam disposal system) via an external program interface in the form of a typed object representing a message with a set of all message properties. The functionality of information delivery to the service is a program (or various programs) that are not part of the system (service). The condition for the operation of this program (programs) is compatibility with the service access interface. Such program(s) may be created by third party developers.

Интерфейс передачи сообщений в сервис подразумевает, что данные передаются в стандартном формате, описанном, в частности, в документе «Свойства».The message passing interface to the service implies that the data is transmitted in a standard format, described, in particular, in the "Properties" document.

Дальнейшая работа системы может быть представлена следующими примерами.Further operation of the system can be represented by the following examples.

Существует компания с доменом электронной почты “компания.ком”.There is a company with the email domain "company.com".

Работнику компании, которому выделен корпоративный адрес электронной почты «инженер1@компания.ком», приходит сообщение из домена «хороший_отдых.рест» с заголовком «Летнее предложение отдыха на курортах Европы».An employee of the company who is assigned a corporate e-mail address "engineer1@company.com" receives a message from the domain "good_rest.rest" with the heading "Summer holiday offer at European resorts".

Соответственно, объект, доставляющий данные такого сообщения в систему, будет иметь свойства:Accordingly, the object that delivers the data of such a message to the system will have the following properties:

From: mail_sender@ хороший_отдых.рестFrom: mail_sender@ good_rest.rest

Subject: Летнее предложение отдыха на курортах ЕвропыSubject: Summer vacation offer in European resorts

To: инженер1@компания.комTo: engineer1@company.com

… другие свойства, не относящиеся к данному примеру.... other properties not relevant to this example.

Этот объект средствами сервиса, отвечающими за сохранение данных в базе данных необработанной информации (1.6 (2.2)), будет сохранен в виде записи в таблице этой базы данных в таком виде, что значение каждого из свойств объекта (From, Subject, To и т.д.) будет сохранено в отдельном поле (столбце) таблицы.This object by means of the service responsible for saving data in the raw information database (1.6 (2.2)) will be saved as a record in the table of this database in such a way that the value of each of the object's properties (From, Subject, To, etc.) will be saved in a separate field (column) of the table.

Далее, установленный на сервере сервис (для системы Windows представленный в виде Службы Windows (англ. Windows Service) — приложение, автоматически (если настроено) исполняемое системой при запуске операционной системы Windows и выполняющиеся вне зависимости от статуса пользователя. Имеет общие черты с концепцией демонов в Unix) запускает по расписанию набор установленных на этом сервере программ (модулей обработки).Further, the service installed on the server (for the Windows system, represented as a Windows Service) is an application that is automatically (if configured) executed by the system when the Windows operating system starts and runs regardless of the user's status. It has common features with the concept of demons in Unix) runs a set of programs (processing modules) installed on this server according to a schedule.

Предположим, что имеется всего один модуль обработки 2.3, ориентированный на обработку данных отправителя, получателя и проверку заголовка сообщения на нарушение закона.Suppose that there is only one processing module 2.3, focused on processing the data of the sender, recipient and checking the message header for violation of the law.

Данный модуль после запуска получает из базы данных необработанной информации 1.6 (2.2) записи с информацией сообщений, еще не обработанных данным модулем.This module, after starting, receives from the database of raw information 1.6 (2.2) records with information of messages that have not yet been processed by this module.

Модуль 2.3 выделяет из объекта сообщения значения свойств From, To и Subject. Модуль проверяет заголовок сообщения (значение свойства Subject) на наличие в нем слов, нарушающих закон.Module 2.3 extracts the values of the From, To, and Subject properties from the message object. The module checks the message header (the value of the Subject property) for the presence of illegal words in it.

Результат данной проверки будет представлен логическим значением: либо «да» (нарушает), либо «нет» (не нарушает). В данном примере результат будет – «нет».The result of this check will be represented by a boolean value: either "yes" (violating) or "no" (not violating). In this example, the result will be "no".

Далее модуль проверяет наличие в базе данных результатов обработки кластеров для отправителя “mail_sender@ хороший_отдых.рест”, получателя “инженер1@компания.ком” и кластера сообщений, не нарушающих закона.Next, the module checks whether the database contains cluster processing results for the sender “mail_sender@ good_rest.rest”, the recipient “engineer1@company.com” and the cluster of messages that do not violate the law.

Если, хотя бы один из таких кластеров не существует в базе данных результатов обработки, то модуль создает соответствующий кластер в базе 2.4 данных результатов обработки.If at least one of these clusters does not exist in the processing results database, then the module creates a corresponding cluster in the processing results database 2.4.

Далее модуль 2.3 добавляет к каждому кластеру информацию из обработанного сообщения, специфичную для данного модуля.Next, module 2.3 adds to each cluster information from the processed message specific to this module.

Затем модуль делает запись в базе данных необработанной информации, что данное сообщение было успешно обработано данным модулем.The module then records in the raw information database that the given message was successfully processed by the given module.

Если точно такое же сообщение было отправлено от этого же отправителя работнику компании с адресом электронной почты контроллер2@компания.ком, то описываемый в примере модуль 2.3 обработки, должен проверить данные этого сообщения и добавить данные этого сообщения к кластеру отправителя (поскольку считаем, что такой кластер создан при обработке предыдущего примера), кластеру соответствия закону (поскольку считаем, что такой кластер создан при обработке предыдущего примера), и создать кластер для получателя “контроллер2@компания.ком” (если такой кластер не был создан ранее).If exactly the same message was sent from the same sender to an employee of the company with the e-mail address controller2@company.com, then the processing module 2.3 described in the example should check the data of this message and add the data of this message to the sender's cluster (since we consider that such the cluster was created when processing the previous example), the legal cluster (because we assume that such a cluster was created when processing the previous example), and create a cluster for the recipient “controller2@company.com” (if such a cluster was not created earlier).

Claims (8)

Способ извлечения информации из спама, содержащий этапы, на которых:A method for extracting information from spam, comprising the steps of: получают сообщения из спам-папок;receive messages from spam folders; сохраняют необработанные сообщения по меньшей мере в одну базу данных необработанных сообщений;storing unprocessed messages in at least one database of unprocessed messages; посредством по меньшей мере одного модуля обработки спама анализируют текст и служебную информацию каждого спам-сообщения в базе данных необработанных сообщений в соответствии с заданным критерием кластеризации спама по заданному критерию;by means of at least one spam processing module, parsing the text and service information of each spam message in the database of raw messages in accordance with a given spam clustering criterion by a given criterion; извлекают полезную информацию из сформированного кластера;extracting useful information from the formed cluster; выполняют антивирусную проверку для предотвращения заражения посредством блока антивирусной защиты и базы данных с информацией о зараженных сообщениях;performing an anti-virus check to prevent infection by means of an anti-virus protection unit and a database with information about infected messages; сохраняют полученную в результате вышеуказанной обработки обработанную информацию в базе данных обработанной информации, где база данных обработанной информации связана по меньшей мере с одним упомянутым модулем обработки спама; иstoring the processed information obtained as a result of the above processing in a processed information database, where the processed information database is associated with at least one of said spam processing module; and предоставляют пользователю результаты обработки посредством модуля предоставления обработанной информации, связанного по меньшей мере с одной упомянутой базой данных обработанной информации.provide the user with the processing results by means of a processed information providing module associated with at least one said database of processed information.
RU2021124532A 2021-08-18 Spam disposal system RU2787308C1 (en)

Publications (1)

Publication Number Publication Date
RU2787308C1 true RU2787308C1 (en) 2023-01-09

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070283440A1 (en) * 2006-05-03 2007-12-06 Anchiva Systems, Inc. Method And System For Spam, Virus, and Spyware Scanning In A Data Network
US20100082749A1 (en) * 2008-09-26 2010-04-01 Yahoo! Inc Retrospective spam filtering
US20130018906A1 (en) * 2011-07-11 2013-01-17 Aol Inc. Systems and Methods for Providing a Spam Database and Identifying Spam Communications
US20190068535A1 (en) * 2017-08-28 2019-02-28 Linkedin Corporation Self-healing content treatment system and method
RU2710739C1 (en) * 2019-03-29 2020-01-10 Акционерное общество "Лаборатория Касперского" System and method of generating heuristic rules for detecting messages containing spam

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070283440A1 (en) * 2006-05-03 2007-12-06 Anchiva Systems, Inc. Method And System For Spam, Virus, and Spyware Scanning In A Data Network
US20100082749A1 (en) * 2008-09-26 2010-04-01 Yahoo! Inc Retrospective spam filtering
US20130018906A1 (en) * 2011-07-11 2013-01-17 Aol Inc. Systems and Methods for Providing a Spam Database and Identifying Spam Communications
US20190068535A1 (en) * 2017-08-28 2019-02-28 Linkedin Corporation Self-healing content treatment system and method
RU2710739C1 (en) * 2019-03-29 2020-01-10 Акционерное общество "Лаборатория Касперского" System and method of generating heuristic rules for detecting messages containing spam

Similar Documents

Publication Publication Date Title
US7421498B2 (en) Method and system for URL based filtering of electronic communications and web pages
Cournane et al. An analysis of the tools used for the generation and prevention of spam
US6460050B1 (en) Distributed content identification system
US20050050150A1 (en) Filter, system and method for filtering an electronic mail message
US20190052586A1 (en) Method and apparatus for classifying electronic messages
US20050015626A1 (en) System and method for identifying and filtering junk e-mail messages or spam based on URL content
US8321512B2 (en) Method and software product for identifying unsolicited emails
US20060149820A1 (en) Detecting spam e-mail using similarity calculations
US8316092B2 (en) Process for automatically handling electronic requests for notification of unsolicited commercial email and other service disruptions
Moustakas et al. E‐mail marketing at the crossroads: A stakeholder analysis of unsolicited commercial e‐mail (spam)
Siponen et al. Effective anti-spam strategies in companies: An international study
CN101087259A (en) A system for filtering spam in Internet and its implementation method
Althobaiti et al. Using clustering algorithms to automatically identify phishing campaigns
US20060259551A1 (en) Detection of unsolicited electronic messages
Ndumiyana et al. Spam detection using a neural network classifier
RU2787308C1 (en) Spam disposal system
Judge et al. Understanding and reversing the profit model of spam (position paper)
Khawandi et al. ASurvey ON IMAGE SPAM DETECTION TECHNIQUES
Cohen et al. Early detection of outgoing spammers in large-scale service provider networks
Arunkrishna et al. Evolutionary Traits In Digital Spam: History, Types, Techniques and Anti Spam Solutions
Ismail et al. Image spam detection: problem and existing solution
Kamoru et al. Spam Detection approaches and strategies: A phenomenon
Srikanthan An Overview of Spam Handling Techniques
Takashita et al. A spam filtering method learning from Web browsing behavior
Valeeva SPAM AND ANTI-SPAM METHODS