[go: up one dir, main page]

RU2411574C2 - Intellectual grid-system for highly efficient data processing - Google Patents

Intellectual grid-system for highly efficient data processing Download PDF

Info

Publication number
RU2411574C2
RU2411574C2 RU2009102806/08A RU2009102806A RU2411574C2 RU 2411574 C2 RU2411574 C2 RU 2411574C2 RU 2009102806/08 A RU2009102806/08 A RU 2009102806/08A RU 2009102806 A RU2009102806 A RU 2009102806A RU 2411574 C2 RU2411574 C2 RU 2411574C2
Authority
RU
Russia
Prior art keywords
computing
programs
grid
intellectual
server
Prior art date
Application number
RU2009102806/08A
Other languages
Russian (ru)
Other versions
RU2009102806A (en
Inventor
Александр Валерьевич Бухановский (RU)
Александр Валерьевич Бухановский
Владимир Николаевич Васильев (RU)
Владимир Николаевич Васильев
Юрий Иванович Нечаев (RU)
Юрий Иванович Нечаев
Original Assignee
Александр Валерьевич Бухановский
Владимир Николаевич Васильев
Юрий Иванович Нечаев
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Александр Валерьевич Бухановский, Владимир Николаевич Васильев, Юрий Иванович Нечаев filed Critical Александр Валерьевич Бухановский
Priority to RU2009102806/08A priority Critical patent/RU2411574C2/en
Publication of RU2009102806A publication Critical patent/RU2009102806A/en
Application granted granted Critical
Publication of RU2411574C2 publication Critical patent/RU2411574C2/en

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Stored Programmes (AREA)

Abstract

FIELD: information technologies.
SUBSTANCE: core of intellectual Grid-system is a server, which selects user programs from relation database, starts these programs at remote highly efficient computer resources, saves results of programs operation in the form of files in database for interaction with server and processing of its commands at each remote computer resource, tracks and notifies the server about the resource status and programs started on it, provides for storage of files with design programs, initial data and results, maintains queues of tasks on the basis of user criteria, tracks conditions of accessible computer resources, transfers user programs to computer systems, reception and preservation of files with produced results.
EFFECT: higher efficiency of functioning of parallel calculations in solution of complex resource-intensive tasks.
12 dwg

Description

Изобретение относится к компьютерным средствам высокопроизводительной обработки данных при решении сложных задач анализа и интерпретации информации в условиях разделения вычислительных и информационных ресурсов на основе открытой интеллектуальной Грид-системы.The invention relates to computer tools for high-performance data processing in solving complex problems of analysis and interpretation of information in the conditions of separation of computing and information resources based on an open intelligent Grid system.

Известен патент JP 9114980, 1997.06.02 «Method and program for selecting GRID executor via neural», в котором предлагается метод Грид-выполнения операций с помощью нейросетевой модели, обучение которой осуществляется на основе структурированных данных, поступающих на вход и выход нейронной сети, причем обученная нейронная сеть осуществляет селективный выбор последовательности функционирования Грид-сети и на выходе выдает интенсивность обслуживания.Known patent JP 9114980, 1997.06.02 "Method and program for selecting GRID executor via neural", which proposes a method for grid-execution of operations using a neural network model, the training of which is based on structured data received at the input and output of a neural network, and A trained neural network makes a selective choice of the sequence of functioning of the Grid-network and at the output it gives out the intensity of service.

Аналогом рассматриваемой Грид-системы является программа «Система удаленного управления распределенными вычислительными ресурсами» (см. свидетельство №2008611206 (07.03.2008). Система удаленного управления разработана с целью объединения территориально распределенных высокопроизводительных вычислительных систем (компьютерных кластеров) в единую систему, обеспечивающую удобство администрирования и использование этих ресурсов. Ядром системы является сервер, который выбирает из реляционной базы данных программы пользователей, запускает эти программы на удаленных высокопроизводительных вычислительных ресурсах и сохраняет результаты работы программ в виде файлов в базе данных для взаимодействия с сервером и обработки его команд на каждом удаленном вычислительном ресурсе, устанавливается программный агент, который отслеживает и сообщает серверу состояние ресурса и запущенных на нем программ. Система обеспечивает хранение файлов с расчетными программами, начальными данными и результатами; поддержку очереди заданий на основе критериев пользователей; отслеживание состояния доступных вычислительных ресурсов; передачу программ пользователей на вычислительные системы; прием и сохранение файлов с результатами.An analogue of the Grid system under consideration is the program “Remote control system for distributed computing resources” (see certificate No.2008611206 (03/07/2008). The remote control system is designed to combine geographically distributed high-performance computing systems (computer clusters) into a single system that provides ease of administration and the use of these resources.The core of the system is a server that selects user programs from a relational database, launches this programs on remote high-performance computing resources and saves the results of programs in the form of files in a database for interacting with the server and processing its commands on each remote computing resource, a software agent is installed that monitors and reports to the server the status of the resource and the programs running on it. storing files with calculation programs, initial data and results; support for the job queue based on user criteria; monitoring the status of available computing resources; transfer of user programs to computer systems; receiving and saving files with results.

Недостаток этой среды связан с отсутствием эффективных процедурных и логических компонент для использования в Грид-среде, которые существенно отличаются от традиционных подходов кластерных систем.The disadvantage of this environment is the lack of effective procedural and logical components for use in the Grid environment, which differ significantly from the traditional approaches of cluster systems.

Более близким аналогом рассматриваемой системы является «Инструментальная оболочка проектирования высокопроизводительных приложений для Грид-архитектур «PEG-2» (см. свидетельство №2008614623 25.09.08), которая рассматривает ресурсную интерпретацию Грид-приложения как среды, предоставляющей пользователю доступ к предметно-ориентированным ресурсам в виде прикладных Грид-сервисов. Отличительной особенностью проектирования и разработки Грид-сервисов является ориентация на использование таких ресурсов, как готовых компонентов с описанием схемы их взаимодействия в нотации потока задач (work-flow). В отличие от блок-схем алгоритмов в системе PEG-2 очередность операций задана неявно и подчиняется принципу передачи управления по наличию исходных данных.A closer analogue of the system under consideration is the “PEG-2” toolkit for designing high-performance applications for Grid architectures (see certificate No. 20088614623 09/25/08), which considers the resource interpretation of the Grid application as an environment that provides the user with access to subject-oriented resources in the form of applied grid services. A distinctive feature of the design and development of grid services is the orientation to the use of resources such as off-the-shelf components with a description of their interaction in the notation of the work flow. In contrast to the flowcharts of the algorithms in the PEG-2 system, the sequence of operations is implicitly set and obeys the principle of transferring control by the availability of source data.

Недостатком инструментальной оболочки PEG-2 является ограниченность функционирования в рамках корпоративной Грид-среды из-за несовершенной организации логики функционирования, а также отсутствие управляющей программы, обеспечивающей интеллектуальную поддержку принятия решений в сложной динамической среде в условиях неоднородности вычислительных ресурсов, неопределенности характеристик задачи и неполноты исходной информации.The disadvantage of the PEG-2 tool shell is the limited functioning within the corporate Grid environment due to the imperfect organization of the functioning logic, as well as the absence of a control program that provides intelligent decision support in a complex dynamic environment in the face of heterogeneous computing resources, uncertainty in the characteristics of the task, and incomplete initial information.

Для обеспечения работоспособности программного инструментария распределенной Грид-системы в условиях растущей сложности инфраструктуры и стохастической изменчивости параметров коммуникационных связей и вычислительных систем возникает необходимость разработки приложения, обеспечивающего объединение и синхронизацию большого количества компьютерных систем, построение прикладных Грид-сервисов и управление вычислительным процессом на основе интеллектуальных технологий.To ensure the availability of software tools for a distributed Grid system under the growing complexity of the infrastructure and the stochastic variability of the parameters of communication links and computer systems, it becomes necessary to develop an application that provides the integration and synchronization of a large number of computer systems, the construction of applied Grid services and the management of the computing process based on intelligent technologies .

Техническим результатом изобретения является повышение эффективности функционирования параллельных вычислений при решении сложных ресурсоемких задач с помощью функциональных блоков, реализующих механизм логического вывода на основе принципа адаптивного резонанса, поиск и извлечение «скрытых» знаний и закономерностей, динамическую модель знаний при организации конкурирующих вычислительных технологий и взаимодействие с пользователем с помощью интеллектуального интерфейса.The technical result of the invention is to increase the efficiency of parallel computing in solving complex demanding tasks using functional blocks that implement a logical inference mechanism based on the principle of adaptive resonance, search and retrieve "hidden" knowledge and patterns, a dynamic knowledge model in the organization of competing computing technologies and interaction with by user using an intelligent interface.

Указанный технический результат достигается путем построения интеллектуальной проблемно-ориентированной Грид-системы на основе системной интеграции вычислительных и информационных компонент. Формализованная логика управления решением ресурсоемких задач при изучении сложных явлений и закономерностей динамических систем, а также при функционировании виртуальных организаций и полигонов позволяет выполнять расчеты и моделирование на основе экспертной системы интеллектуальной поддержки принятия решений, блока адаптации, обеспечивающего выбор предпочтительной вычислительной технологии обработки данных, настройку логических моделей на восприятие новой информации и извлечение «скрытых» знаний, интеллектуального интерфейса, поддерживающего взаимодействие пользователей с компьютерной средой интеллектуальной Грид-системы.The indicated technical result is achieved by constructing an intellectual problem-oriented Grid system based on system integration of computing and information components. The formalized logic for managing the solution of resource-intensive tasks in the study of complex phenomena and patterns of dynamic systems, as well as the functioning of virtual organizations and polygons, allows you to perform calculations and modeling based on an expert system of intelligent decision support, an adaptation unit that provides the choice of the preferred computing technology for data processing, setting logical models for the perception of new information and the extraction of "hidden" knowledge, an intelligent interface and supporting user interaction with the computing environment intelligent grid system.

Функциональная схема системы представлена на фиг.1.Functional diagram of the system is presented in figure 1.

Система включает 4 основных блока: блок интеллектуальной поддержки функционирования Грид-системы 1, блок программного управления 2, блок человеко-компьютерного взаимодействия 3, блок прикладных Грид-сервисов 4.The system includes 4 main blocks: a block of intellectual support for the functioning of the Grid system 1, a program control block 2, a block of human-computer interaction 3, a block of applied Grid services 4.

Блок интеллектуальной поддержки 1 (фиг.2) является основным элементом, обеспечивающим функционирование компьютерного комплекса. В состав блока входят экспертная система 5, генератор композитного приложения 6 и блок адаптации 7.The block of intellectual support 1 (figure 2) is the main element that ensures the functioning of the computer complex. The block includes an expert system 5, a composite application generator 6, and an adaptation block 7.

Блок программного управления 2 (фиг.3) реализует функции интеллектуальной поддержки принятия решений при выполнении высокопроизводительных вычислений в интеллектуальной Грид-системе. На основе исходной информации, поступившей на выполнение сложной задачи, блок 2 осуществляет семантический поиск по описанию задачи 8 и, взаимодействуя с базой знаний экспертной системы 5, получает информацию о доступных сервисах и их онтологических описаниях 4 и осуществляет вызов интерпретатора 9, балансировочных алгоритмов 10 и элемента прогнозирования времени выполнения Грид-приложений 11.The program control unit 2 (Fig. 3) implements the functions of intelligent decision support when performing high-performance computing in an intelligent Grid system. Based on the initial information received to complete a complex task, block 2 performs a semantic search for the description of task 8 and, interacting with the knowledge base of the expert system 5, receives information about the available services and their ontological descriptions 4 and calls the interpreter 9, balancing algorithms 10 and Grid Application Runtime Prediction Element 11.

Блок человеко-компьютерного взаимодействия 3 (фиг.4) осуществляет функции ввода и вывода информации и содержит четыре базовых компоненты: блок интеллектуального интерфейса 12, осуществляющий разработку и запуск задания, блок представления информации 13, блок визуализации 14, блок документирования 15.The unit of human-computer interaction 3 (Fig. 4) performs the functions of input and output of information and contains four basic components: an intelligent interface unit 12, which carries out the development and launch of a task, an information presentation unit 13, a visualization unit 14, and a documentation unit 15.

Блок прикладных Грид-сервисов 4 (фиг.5) обеспечивает выполнение пользовательского задания на удаленных целевых системах и включает дополнительные функциональные элементы: виртуальную оболочку проектирования 16, элемент представления (нотация) 17 в виде набора блоков, соответствующих основным операциям прикладных Грид-сервисов и взаимосвязей между ними, определяющих обмен данными, элемент балансировки и построения расписаний 18, планировщик 19, который на основе знаний о сервисах и исходных данных создает набор альтернативных методов построения и выбора вариантов решений и расписаний.The block of applied grid services 4 (Fig. 5) provides the execution of a user task on remote target systems and includes additional functional elements: a virtual design shell 16, a presentation element (notation) 17 in the form of a set of blocks corresponding to the main operations of applied grid services and relationships between them, which determine the exchange of data, the element of balancing and scheduling 18, the scheduler 19, which, based on knowledge of services and source data, creates a set of alternative methods for posting oeniya choices and decisions and schedules.

Экспертная система предметных областей 5 (фиг.6) обеспечивает функционирование Грид-системы в заданной вычислительной среде и включает следующие базы знаний: базу знаний предметно-ориентированного описания сервисов 20, базу знаний характеристик производительности вычислительных сервисов 21, базу знаний характеристик производительности моделей основных операций и взаимодействий между ними 22, базу знаний характеристик достоверности интерпретируемых знаний 23, механизм логического вывода на основе принципа адаптивного резонанса 24, систему объяснений 25, общесистемную базу данных 26. Базы знаний экспертной системы 5 содержат наборы понятий предметной области в виде фреймово-продукционных моделей, причем модель представления предметных знаний реализуется с использованием онтологии в виде семантической сети, множество узлов которой соответствует фактам, а множество дуг отражает логические связи между ними.The expert system of subject areas 5 (Fig. 6) ensures the functioning of the Grid system in a given computing environment and includes the following knowledge bases: a knowledge base of a subject-oriented description of services 20, a knowledge base of performance characteristics of computing services 21, a knowledge base of performance characteristics of basic operations models and interactions between them 22, the knowledge base of the characteristics of the reliability of the interpreted knowledge 23, the inference mechanism based on the principle of adaptive resonance 24, the system explanations 25, the system-wide database 26. The knowledge bases of the expert system 5 contain sets of concepts of the subject area in the form of frame-production models, and the model for representing subject knowledge is implemented using an ontology in the form of a semantic network, the set of nodes of which corresponds to the facts, and the set of arcs reflects logical connections between them.

Логический вывод на основе принципа адаптивного резонанса (блок 24) реализует блок-схема, представленная на фиг.7. Динамическая модель знаний, использующая этот принцип, ориентирована на перестройку логических моделей и формализацию информации, содержащуюся в базах знаний 20-23, в условиях неопределенности входных данных, стохастичности параметров Грид-среды, слабой формализации постановки задачи. В процессе функционирования блока 24 осуществляется проверка соответствия исходных данных логической системе фреймово-продукционных моделей и последующая корректировка логических правил экспертной системы 5, связанная с модификацией имеющихся правил, либо построением новых правил, соответствующих исходным данным.The logical conclusion based on the principle of adaptive resonance (block 24) implements the block diagram shown in Fig.7. A dynamic knowledge model using this principle is focused on the restructuring of logical models and the formalization of information contained in knowledge bases 20-23, under conditions of uncertainty of input data, stochastic parameters of the Grid environment, and weak formalization of the problem statement. In the process of functioning of block 24, a check is made of the correspondence of the initial data to the logical system of frame-production models and the subsequent correction of the logical rules of the expert system 5, associated with the modification of existing rules, or the construction of new rules corresponding to the initial data.

Блок адаптации 7 (фиг.8) реализует процедуры адаптивного обучения за счет возможности управления вычислительным процессом с динамически меняющейся информацией. При этом обеспечивается взаимодействие с базой данных 26 экспертной системы 5, содержащей прикладные компьютерные программы расчета и моделирования, и блоком прикладных Грид-сервисов 4. Помимо этого блок адаптации 7 осуществляет реализацию принципа конкуренции при выборе предпочтительной вычислительной технологии 27, поддержку процесса поиска и извлечения «скрытых» знаний и закономерностей 28 (процедуры интеллектуального анализа данных - Data Mining), особенно интеграцию знаний в условиях неоднородности вычислительных ресурсов, стохастической изменчивости параметров коммуникационных сетей и вычислительных систем, неопределенности характеристик задачи и неполноты исходной информации.The adaptation unit 7 (Fig. 8) implements adaptive learning procedures due to the ability to control the computing process with dynamically changing information. This ensures interaction with the database 26 of the expert system 5, containing applied computer programs for calculating and modeling, and the block of applied grid services 4. In addition, the adaptation block 7 implements the principle of competition when choosing the preferred computing technology 27, supporting the search and retrieval process " hidden "knowledge and patterns 28 (data mining procedures - Data Mining), especially the integration of knowledge in the face of heterogeneous computing resources, is stochastic the variability of the parameters of communication networks and computer systems, the uncertainty of the characteristics of the problem and the incompleteness of the initial information.

Алгоритм реализации принципа конкуренции (блок 27) при решении сложных задач в процессе функционирования интеллектуальной Грид-системы состоит в выполнении следующих шагов:The algorithm for implementing the principle of competition (block 27) in solving complex problems in the process of functioning of the intellectual grid system consists in performing the following steps:

Шаг 1. Генерация альтернативных решений задачи с помощью генератора композитного приложения 6.Step 1. Generation of alternative solutions to the problem using the composite application generator 6.

Шаг 2. Выбор конкурирующих вычислительных технологий на основе семантического поиска по описанию задачи 8 в виде стандартных алгоритмов (блок 17) и нейросетевых моделей (блок 35).Step 2. The selection of competing computing technologies based on semantic search for the description of task 8 in the form of standard algorithms (block 17) and neural network models (block 35).

Шаг 3. Параллельное решение задачи с помощью интерпретатора 9, балансировочных алгоритмов 10 и интеллектуального интерфейса 12.Step 3. Parallel solution of the problem using the interpreter 9, balancing algorithms 10 and intelligent interface 12.

Шаг 4. Анализ альтернатив и выбор предпочтительного решения с помощью планировщика 19 и блока 24, реализующего механизм логического вывода на основе принципа адаптивного резонанса.Step 4. Analysis of alternatives and the choice of the preferred solution using the scheduler 19 and block 24, which implements the inference mechanism based on the principle of adaptive resonance.

Операции по выполнению шагов 1-4 осуществляются в блоке 36 с помощью экспертной системы 5 и интеллектуального интерфейса 12.The operations to perform steps 1-4 are carried out in block 36 using an expert system 5 and an intelligent interface 12.

Другая операция, выполняемая в блоке адаптации 7, связана с выявлением «скрытых» знаний и закономерностей 28 (фиг.9) на основе статистического анализа 29, байесовской сети 30, метода иерархий 31, деревьев решений 32, принципа редукции 33, онтологии 34, искусственных нейронных сетей 35, формального концептуального анализа 36.Another operation performed in adaptation block 7 is associated with revealing “hidden” knowledge and patterns 28 (Fig. 9) based on statistical analysis 29, Bayesian network 30, hierarchy method 31, decision trees 32, reduction principle 33, ontology 34, artificial neural networks 35, formal conceptual analysis 36.

Блок интеллектуального интерфейса 12 (фиг.10) представляет собой программно-аналитический комплекс, обеспечивающий «прозрачность» смысла доступа к информации при поддержании взаимодействия пользователей с помощью блока программного управления 2, блока адаптации 7 и блока документирования 15. Интеллектуальный интерфейс 12 ориентирован на формализацию понятий предметной области и включает четыре основных модуля: синтаксический анализатор 37, выполняющий процедуры морфологического и синтаксического анализа предложений входной информации, семантический анализатор 38, использующий результаты синтаксического анализа для формализации информационного содержания входных данных, процессор понятийного словаря 39, представляющий собой библиотеку функций, обеспечивающих вычисление характеристик, представленных в словаре понятий, и полного набора отношений между ними, а также фиксированного набора ассоциативных отношений вида «часть - целое», «устройство - функция», процессор справочника баз данных 40, который характеризует модели предметных областей, определяющих функционирование интеллектуальной Грид-системы с помощью средств адаптации 7 и блока программного управления 2. В сложных ситуациях с помощью интеллектуального интерфейса 12 реализуется взаимосвязь блока адаптации 7 с блоком интеллектуальной поддержки 1, обеспечивающим функциональные возможности интеллектуальной Грид-системы.The intelligent interface unit 12 (Fig. 10) is a software-analytical complex that provides "transparency" of the meaning of access to information while maintaining user interaction using the program control unit 2, adaptation unit 7 and documenting unit 15. The intelligent interface 12 is focused on formalizing concepts subject area and includes four main modules: a parser 37 that performs the procedures of morphological and syntactic analysis of sentences of input information , a semantic analyzer 38, using the results of parsing to formalize the information content of the input data, a conceptual dictionary processor 39, which is a library of functions that compute the characteristics presented in the conceptual dictionary and a complete set of relations between them, as well as a fixed set of associative relations of the form " part - the whole "," device - function ", a processor of the database reference guide 40, which characterizes the models of subject areas that determine the functional Contents Intellectual Grid system using adaptation means 7 and the software of the control unit 2. In complex situations through an intelligent interface 12 is implemented relationship adaptation unit 7 with intellectual support unit 1, providing functionality Intellectual grid system.

Модульный принцип построения интеллектуальной Грид-системы высокопроизводительной обработки данных реализуется на автономных носителях информации с применением самостоятельно функционирующих блоков: блока интеллектуальной поддержки Грид-системы 1, блока программного управления 2, блока человеко-компьютерного взаимодействия 3, блока прикладных Грид-сервисов 4. Инструментальная среда интеллектуальной Грид-системы, как совокупности вычислительных ресурсов, использующих проблемно-ориентированные Грид-сервисы 4, обеспечивает формализацию процесса проектирования композитных вычислительных приложений, достигающих оптимальной производительности с использованием интеллектуальных технологий.The modular principle of constructing an intelligent Grid system of high-performance data processing is implemented on autonomous storage media using independently functioning units: an intellectual support unit of the Grid system 1, a program control unit 2, a human-computer interaction unit 3, an application Grid services unit 4. Tool environment intellectual Grid system, as a set of computing resources using problem-oriented Grid services 4, provides formalism the process of designing composite computing applications that achieve optimal performance using intelligent technologies.

Реализация интеллектуальной Грид-системы высокопроизводительной обработки данных осуществляется с использованием стандартных технических средств высокопроизводительных вычислений с использованием языка программирования Jawa 5. В оболочке PEGI реализована основная функциональность, определяющая взаимодействие с инфраструктурой интеллектуальной Грид-системы на основе Intel Grid Programming Emvironment (GPE). Процедура использует библиотеки GPE API версии 1.5, которые являются надстройкой над средой Globus. Это решение позволяет изолировать реализацию инструментальной оболочки от особенностей архитектуры интеллектуальной Грид-системы. Элемент исполнения в оболочках PEG2 обеспечивает реализацию пользовательского задания 4 на удаленных целевых системах: осуществляя вызовы интерпретатора 9 WF (workflow), балансировочных алгоритмов 10 и осуществляя мониторинг с помощью интеллектуального интерфейса 12. В инструментальной оболочке вводятся дополнительные функциональные элементы, в частности визуальная оболочка проектирования 14, элемент представления WF 13, элемент мониторинга интеллектуальной Грид-системы 12 и элемент прогнозирования времени выполнения приложений 11. Визуальная оболочка 3, 14 реализует процесс человеко-компьютерного взаимодействия в графической форме. Элемент WF по существу является интерпретатором 9 пользовательской постановки задачи 12 для дальнейшего использования другими элементами программного комплекса 1-4. Элементы мониторинга среды интеллектуальной Грид-системы 1 и прогнозирования времени работы композитного приложения 11 используются элементом балансировки и построения расписаний 10 для создания конкретного workflow - CWF, имеющего наибольшую производительность.Implementation of an intelligent Grid system for high-performance data processing is carried out using standard technical means of high-performance computing using the Jawa 5 programming language. The PEGI shell implements the main functionality that defines the interaction with the infrastructure of an intelligent Grid system based on Intel Grid Programming Emvironment (GPE). The procedure uses the GPE API libraries version 1.5, which are an add-on for the Globus environment. This solution allows you to isolate the implementation of the instrumental shell from the architectural features of the intellectual grid system. The execution element in the PEG2 shells provides the implementation of user task 4 on remote target systems: by calling the interpreter 9 WF (workflow), balancing algorithms 10 and monitoring using the smart interface 12. Additional functional elements are introduced into the tool shell, in particular, the visual design shell 14 , the presentation element WF 13, the monitoring element of the intelligent Grid system 12 and the element for predicting the runtime of applications 11. Visual olochka 3, 14 implements a process of human-computer interaction in graphical form. The WF element is essentially an interpreter 9 of the user-defined problem statement 12 for further use by other elements of the software package 1-4. Elements of monitoring the environment of the intelligent Grid system 1 and predicting the runtime of the composite application 11 are used by the balancing and scheduling element 10 to create a specific workflow - CWF that has the highest performance.

Обобщенная схема функционирования интеллектуальной Грид-системы представлена на фиг.11. На этапе проектирования пользователь посредством визуальной оболочки выполняет интерпретацию композитного приложения в форме MWF (meta workflow). При этом используются знания о соответствующем наборе доступных прикладных Грид-сервисов 4, которые предоставляются системой управления знаниями Grid Knowledge Manager 2. Это описание передается планировщику Workflow Planner 19, который на основании знаний о сервисах 20, 21, 22, 23 и данных 26 создает набор альтернативных Workflow - AWF. Каждый AWF представляет собой непротиворечивый процесс вычислений с фиксированным прикладным Грид-сервисом и исходными данными. На основе набора AWF блоком построения расписаний (Workflow Scheduler) 18 строится набор конкретных расписаний выполнения (CWF). Расписание, наиболее точно соответствующее пользовательским критериям, принимается окончательным и передается на выполнение. По завершении выполнения задач на целевых системах Workflow Executor с помощью экспертной системы 5 и интеллектуального интерфейса 12 осуществляется сбор результатов работы и пользователю предоставляется окончательный результат в виде файла данных 13. При возникновении нестандартных ситуаций, связанных с решением больших задач в сложной динамической среде в условиях неоднородности вычислительных ресурсов, описанная выше последовательность функционирования интеллектуальной Грид-системы дополняется процедурами, реализующими механизм логического вывода на основе принципа адаптивного резонанса 24 и процедур выявления «скрытых» знаний 28 при поддержке интеллектуального интерфейса 12.A generalized scheme of the functioning of the intellectual grid system is presented in Fig. 11. At the design stage, the user through the visual shell interprets the composite application in the form of MWF (meta workflow). In this case, knowledge about the corresponding set of available Grid application services 4, which are provided by the knowledge management system Grid Knowledge Manager 2, is used. This description is transmitted to the Workflow Planner 19, which, based on knowledge about services 20, 21, 22, 23 and data 26, creates a set Alternative Workflow - AWF. Each AWF is a consistent computing process with a fixed application grid service and raw data. Based on the AWF set, the Workflow Scheduler 18 builds a set of specific execution schedules (CWFs). The schedule that most closely matches the user criteria is finalized and submitted for execution. Upon completion of the tasks on the target Workflow Executor systems using the expert system 5 and the intelligent interface 12, the work results are collected and the final result is provided in the form of a data file 13. If unusual situations arise when solving large problems in a complex dynamic environment under heterogeneous conditions computing resources, the sequence of functioning of the intellectual grid system described above is supplemented by procedures that implement the logic conclusion based on the principle of adaptive resonance 24 and procedures for identifying “hidden” knowledge 28 with the support of an intelligent interface 12.

В качестве примера практического использования разработанной интеллектуальной технологии ниже рассмотрена одна их сложных и трудоемких задач на примере обработки геофизической информации - анализ климатических спектров морского волнения. Результаты функционирования интеллектуальной Грид-системы при решении этой задачи иллюстрирует фиг.12.As an example of the practical use of the developed intellectual technology, one of their complex and time-consuming tasks is considered below on the example of processing geophysical information - analysis of the climatic spectra of sea waves. The results of the functioning of the intelligent Grid system in solving this problem is illustrated in Fig. 12.

Здесь представлены характеристики времени обработки массива из 8 тысяч спектров, полученные на интеллектуальной Грид-системе, состоящей из 24 целевых систем. В процессе решения задачи производилось статистическое обобщение заданных функций распределения энергии волн по частотам и направлениям в фиксированной точке пространства за длительный интервал времени. Приведенные на фиг.13 данные иллюстрируют зависимость времени выполнения задачи от числа вычислителей в виде ядерных оценок плотности распределения времени работы для трех конкурирующих технологий параллельных вычислений (схем расписаний): равномерная схема 1, прямая 2 и обратная 3 каскадные схемы. Видно, что с увеличением количества вычислителей (р=2÷4) разброс времени выполнения возрастает, что связано с ростом влияния стохастических эффектов коммуникаций в рассмотренной Грид-системе. При этом взаимное расположение плотностей распределения определяют правила ранжирования конкурирующих расписаний. Например, в случае «А» (фиг.12) для р=2 прямая и обратная каскадные схемы приводят в среднем к практически одинаковым оценкам времени работы. Различие между ними существенно меньше соответствующего диапазона изменчивости, однако, разброс времени работы для прямой каскадной схемы в 1,5 раза больше, чем для обратной каскадной схемы. Поэтому окончательный выбор схемы распараллеливания определяется исходя из стратегии: меньший риск - меньшая производительность или больший риск - большая производительность.Here are the characteristics of the processing time of an array of 8 thousand spectra obtained on an intelligent grid system consisting of 24 target systems. In the process of solving the problem, a statistical generalization of the given functions of the distribution of wave energy in frequencies and directions at a fixed point in space over a long period of time was carried out. The data shown in Fig. 13 illustrates the dependence of the task execution time on the number of calculators in the form of nuclear estimates of the distribution density of the operating time for three competing parallel computing technologies (schedule schemes): uniform circuit 1, direct 2, and inverse 3 cascade schemes. It can be seen that with an increase in the number of calculators (p = 2 ÷ 4), the spread in the execution time increases, which is associated with an increase in the influence of stochastic communication effects in the considered Grid system. In this case, the relative position of the distribution densities is determined by the rules for ranking competing schedules. For example, in case "A" (Fig. 12) for p = 2, the forward and reverse cascade circuits lead on average to almost identical estimates of the operating time. The difference between them is much smaller than the corresponding range of variability, however, the variation in operating time for a direct cascade circuit is 1.5 times greater than for a reverse cascade circuit. Therefore, the final choice of the parallelization scheme is determined based on the strategy: less risk - less productivity or more risk - more productivity.

С другой стороны, в процессе выполнения задачи возможны случаи (ситуация «Б» при р=24), когда плотности распределения времени работы для разных схем перекрываются, однако, различие между средними значениями сопоставимо с их диапазоном изменчивости. Тогда ранжирование конкурирующих расписаний необходимо вести с учетом заданного уровня значимости ошибки. В частности, в ситуации «Б» в 5% случаев обратная каскадная схема будет давать лучший по производительности результат, чем равномерная, несмотря на то, что в среднем равномерная схема работает в 1,5 раза быстрее. Из фиг.12 также видно, что кривые производительности имеют ярко выраженный минимум: для каскадных схем при р=6, для равномерной - при р=12, который определяет оптимальный режим выполнения задачи. Максимальное ускорение в среднем составляет около 2,5, а выигрыш по сравнению с конкурирующими каскадными расписаниями - в 2 раза, что характерно для Грид-систем в силу существенного вклада коммуникационной составляющей как одного из определяющих факторов (наравне с объемом доступной памяти, дискового пространства и пр.),On the other hand, in the process of performing the task, there are possible cases (situation “B” at p = 24), when the distribution densities of the operating time for different schemes overlap, however, the difference between the average values is comparable with their range of variability. Then the ranking of competing schedules must be carried out taking into account a given level of significance of the error. In particular, in situation “B”, in 5% of cases, the reverse cascade circuit will give a better result than the uniform one, despite the fact that on average the uniform circuit works 1.5 times faster. 12 also shows that the performance curves have a pronounced minimum: for cascade circuits at p = 6, for uniform circuits at p = 12, which determines the optimal mode of task execution. The maximum acceleration on average is about 2.5, and the gain in comparison with competing cascade schedules is 2 times, which is typical for Grid systems due to the significant contribution of the communication component as one of the determining factors (along with the amount of available memory, disk space and etc.),

Таким образом, реализация интеллектуальной Грид-системы обеспечивает гибкое, скоординированное, раздельное использование разнообразных компьютерных ресурсов удаленных виртуальных организаций как сообщества пользователей с динамически меняющимся составом для совместного использования распределенных Грид-ресурсов в рамках общих научных и технических целей и задач.Thus, the implementation of the intelligent Grid system provides a flexible, coordinated, separate use of various computer resources of remote virtual organizations as a community of users with dynamically changing composition for sharing distributed Grid resources within the framework of common scientific and technical goals and objectives.

Claims (1)

Интеллектуальная Грид-система для высокопроизводительной обработки данных, содержащая формализованную логику функционирования совокупности территориально распределенных высокопроизводительных вычислительных систем, объединенных в единую систему, обеспечивающую удобство администрирования и использования ресурсов, ядром которой является сервер, который выбирает из реляционной базы данных программы пользователей, запускает эти программы на удаленных высокопроизводительных вычислительных ресурсах и сохраняет результаты работы программ в виде файлов в базе данных для взаимодействия с сервером и обработки его команд на каждом удаленном вычислительном ресурсе, отслеживает и сообщает серверу состояние ресурса и запущенных на нем программ, обеспечивает хранение файлов с расчетными программами, начальными данными и результатами, поддерживает очереди заданий на основе критериев пользователей, отслеживает состояния доступных вычислительных ресурсов, осуществляет передачу программ пользователей на вычислительные системы, прием и сохранение файлов с полученными результатами, отличающаяся тем, что интеллектуальная проблемно-ориентированная Грид-система реализована на основе системной интеграции вычислительных и информационных компонент, формализованная логика управления которыми связана с решением ресурсоемких задач при изучении сложных явлений и закономерностей динамических систем, а также при функционировании виртуальных организаций и полигонов при выполнении сложных расчетов и моделирования, для чего в компьютерный комплекс дополнительно введены блок интеллектуальной поддержки функционирования Грид-системы, взаимосвязанный посредством блока программного управления с блоками человеко-компьютерного взаимодействия и блоком прикладных Грид-сервисов, причем блок интеллектуальной поддержки содержит экспертную систему, обеспечивающую функционирование Грид-системы в заданной вычислительной среде и принятие решений по управлению вычислительными процессами, блок адаптации, реализующий процедуры адаптивного обучения за счет возможности управления вычислительным процессом с динамически меняющейся информацией, выбор предпочтительной вычислительной технологии обработки данных, настройку логических моделей на восприятие новой информации и извлечение «скрытых» знаний, генератор композитного приложения, реализующий функции выработки альтернативных решений, блок человеко-компьютерного взаимодействия содержащий интеллектуальный интерфейс, поддерживающий взаимодействие пользователей с вычислительной средой в условиях неоднородности вычислительных ресурсов, неопределенности характеристик задачи и неполноты исходной информации. Intelligent Grid system for high-performance data processing, containing a formalized logic of the functioning of a set of geographically distributed high-performance computing systems, combined into a single system that provides ease of administration and use of resources, the core of which is a server that selects user programs from a relational database, runs these programs on remote high-performance computing resources and saves work results A program in the form of files in the database for interacting with the server and processing its commands on each remote computing resource, monitors and reports to the server the status of the resource and the programs running on it, provides storage of files with calculation programs, initial data and results, supports job queues based on user criteria, monitors the status of available computing resources, transfers user programs to computing systems, receives and stores files with received p results, characterized in that the intellectual problem-oriented Grid system is implemented on the basis of system integration of computing and information components, the formalized control logic of which is associated with solving resource-intensive problems in the study of complex phenomena and patterns of dynamic systems, as well as in the functioning of virtual organizations and polygons at performing complex calculations and modeling, for which an intellectual support function block was additionally introduced into the computer complex ionization of the Grid system, interconnected by means of a program control unit with human-computer interaction units and a block of applied Grid services, and the intellectual support unit contains an expert system that ensures the operation of the Grid system in a given computing environment and decision-making on the management of computing processes, adaptation unit that implements adaptive learning procedures due to the ability to control a computing process with dynamically changing information, choice preferred computing technology for data processing, setting logical models to perceive new information and extracting “hidden” knowledge, a composite application generator that implements the functions of developing alternative solutions, a human-computer interaction unit containing an intelligent interface that supports user interaction with the computing environment under conditions of heterogeneous computing resources , the uncertainties of the characteristics of the problem and the incompleteness of the source information.
RU2009102806/08A 2009-01-29 2009-01-29 Intellectual grid-system for highly efficient data processing RU2411574C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2009102806/08A RU2411574C2 (en) 2009-01-29 2009-01-29 Intellectual grid-system for highly efficient data processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2009102806/08A RU2411574C2 (en) 2009-01-29 2009-01-29 Intellectual grid-system for highly efficient data processing

Publications (2)

Publication Number Publication Date
RU2009102806A RU2009102806A (en) 2010-08-10
RU2411574C2 true RU2411574C2 (en) 2011-02-10

Family

ID=42698537

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009102806/08A RU2411574C2 (en) 2009-01-29 2009-01-29 Intellectual grid-system for highly efficient data processing

Country Status (1)

Country Link
RU (1) RU2411574C2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2485581C1 (en) * 2012-04-26 2013-06-20 Открытое акционерное общество "Лётно-исследовательский институт имени М.М.Громова" Expert search engine
RU2569568C1 (en) * 2014-12-12 2015-11-27 федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики (Университет ИТМО) Method of monitoring emergency situations based on integration of computer and information components of grid system
RU2596992C2 (en) * 2014-12-12 2016-09-10 федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики" (Университет ИТМО) Method for designing a multi-mode intelligent control system of distributed environment of soft computations
RU2649748C2 (en) * 2016-08-24 2018-04-04 Федеральное государственное бюджетное образовательное учреждение высшего образования "Московский государственный университет имени М.В. Ломоносова" (МГУ) System and method for interpreting and analyzing dynamic characteristics of the current state of tasks performed
CN110245011A (en) * 2018-03-08 2019-09-17 北京京东尚科信息技术有限公司 A kind of method for scheduling task and device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2300846C2 (en) * 2001-03-28 2007-06-10 Квэлкомм Инкорпорейтед Method and device for transmitting service messages in wireless communication system
RU2302276C2 (en) * 2002-04-25 2007-07-10 Ай Джи Ти Authentication in protected computerized game system
EP1981242A2 (en) * 2007-04-12 2008-10-15 Sun Microsystems Inc. Method and system for securing a commercial grid network
WO2008122964A2 (en) * 2007-04-06 2008-10-16 France Telecom A grid accounting method and system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2300846C2 (en) * 2001-03-28 2007-06-10 Квэлкомм Инкорпорейтед Method and device for transmitting service messages in wireless communication system
RU2302276C2 (en) * 2002-04-25 2007-07-10 Ай Джи Ти Authentication in protected computerized game system
WO2008122964A2 (en) * 2007-04-06 2008-10-16 France Telecom A grid accounting method and system
EP1981242A2 (en) * 2007-04-12 2008-10-15 Sun Microsystems Inc. Method and system for securing a commercial grid network

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2485581C1 (en) * 2012-04-26 2013-06-20 Открытое акционерное общество "Лётно-исследовательский институт имени М.М.Громова" Expert search engine
RU2569568C1 (en) * 2014-12-12 2015-11-27 федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики (Университет ИТМО) Method of monitoring emergency situations based on integration of computer and information components of grid system
RU2596992C2 (en) * 2014-12-12 2016-09-10 федеральное государственное автономное образовательное учреждение высшего образования "Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики" (Университет ИТМО) Method for designing a multi-mode intelligent control system of distributed environment of soft computations
RU2649748C2 (en) * 2016-08-24 2018-04-04 Федеральное государственное бюджетное образовательное учреждение высшего образования "Московский государственный университет имени М.В. Ломоносова" (МГУ) System and method for interpreting and analyzing dynamic characteristics of the current state of tasks performed
CN110245011A (en) * 2018-03-08 2019-09-17 北京京东尚科信息技术有限公司 A kind of method for scheduling task and device

Also Published As

Publication number Publication date
RU2009102806A (en) 2010-08-10

Similar Documents

Publication Publication Date Title
CN115543639B (en) Optimization method for performing deep learning tasks in distributed mode and distributed system
Herodotou et al. A survey on automatic parameter tuning for big data processing systems
US11481456B2 (en) Model and pattern structure online unital learning: mapsoul
Li et al. Machine learning based online performance prediction for runtime parallelization and task scheduling
Mannem et al. Leveraging supervised learning in cloud architectures for automated repetitive tasks
CN117370638B (en) Basic model task decomposition and scheduling method and device enhanced by mind map prompts
CN117076077A (en) Planning and scheduling optimization method based on big data analysis
RU2411574C2 (en) Intellectual grid-system for highly efficient data processing
CN118656196A (en) Multi-stage task processing method, device and medium based on intelligent agent model
Karabetian et al. An environmentally-sustainable dimensioning workbench towards dynamic resource allocation in cloud-computing environments
Rahman et al. SMBSP: a self-tuning approach using machine learning to improve performance of spark in big data processing
Amini et al. Distributed llms and multimodal large language models: A survey on advances, challenges, and future directions
Majid et al. A review of deep reinforcement learning in serverless computing: function scheduling and resource auto-scaling
Balis et al. Improving prediction of computational job execution times with machine learning
Blum et al. Hybrid metaheuristics
Sliwko Cluster Workload Allocation: A Predictive Approach Leveraging Machine Learning Efficiency
Konovalov et al. Job control in heterogeneous computing systems
Do et al. Co-scheduling ensembles of in situ workflows
Kritikakou et al. A systematic approach to classify design-time global scheduling techniques
Fan Intelligent Job Scheduling on High Performance Computing Systems
Zhai et al. Learning splitting heuristics in divide-and-conquer SAT solvers with reinforcement learning
Nedoshivina et al. AI-driven Workload Management in Meta OS
Wu et al. Learning Virtual Machine Scheduling in Cloud Computing through Language Agents
Lubrano et al. Advanced Resource Allocation in the Context of Heterogeneous Workflows Management
Sehrawat An Adaptive and Priority Improved Task Scheduling Model for Fog Computing Environment

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20130130