KR20220083630A - 다중 분산 데이터베이스 환경에서 이종 데이터세트의 임베딩 벡터를 이용한 딥 러닝 학습 - Google Patents
다중 분산 데이터베이스 환경에서 이종 데이터세트의 임베딩 벡터를 이용한 딥 러닝 학습 Download PDFInfo
- Publication number
- KR20220083630A KR20220083630A KR1020210178067A KR20210178067A KR20220083630A KR 20220083630 A KR20220083630 A KR 20220083630A KR 1020210178067 A KR1020210178067 A KR 1020210178067A KR 20210178067 A KR20210178067 A KR 20210178067A KR 20220083630 A KR20220083630 A KR 20220083630A
- Authority
- KR
- South Korea
- Prior art keywords
- deep learning
- learning
- data
- model
- embedding vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/275—Synchronous replication
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/235—Update request formulation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 본 발명의 실시예에 따른 딥 러닝 학습 장치의 구성도이다.
도 3은 본 발명의 실시예에 따른 딥 러닝 학습 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 실시예에 따른 다중 분산 데이터허브로부터 발생하는 데이터세트 업데이트 스트림으로부터 딥 러닝 스케줄링 방법을 설명하기 위한 예시도이다.
도 5는 본 발명의 실시예에 다른 딥러닝 모델 학습에서 학습 태스크 데이터 스트림을 기반으로 가중 경사치 및 임베딩 벡터를 생성하여 예측 스트림을 생성하는 과정을 설명하기 위한 예시도이다.
110: 입력부
120: 프로세서부
Claims (10)
- 다중 분산 데이터베이스 환경에서 딥 러닝 학습 장치가 수행하는 딥 러닝 학습 방법으로서,
다중 분산 데이터베이스의 이종 데이터세트를 시계열 기준으로 병합하여 모델 학습을 위한 입력 스트림을 생성하는 단계와,
상기 입력 스트림에 대한 임베딩 벡터를 생성하는 단계와,
상기 임베딩 벡터를 딥 러닝 모델의 학습과 기학습된 딥 러닝 모델을 통한 추론 중 적어도 하나에 적응적으로 반영하는 단계를 포함하는
딥 러닝 학습 방법. - 제 1 항에 있어서,
상기 반영하는 단계는,
상기 임베딩 벡터를 통해 기울기를 계산하는 단계와,
상기 기울기를 이용하여 딥 러닝 모델의 파라미터를 학습시키는 단계를 포함하는
딥 러닝 학습 방법. - 제 2 항에 있어서,
상기 계산하는 단계에서 패턴 기반의 정규화를 적용해 상기 기울기를 계산하고, 상기 학습시키는 단계에서 상기 정규화를 적용한 기울기를 이용하는
딥 러닝 학습 방법. - 제 1 항에 있어서,
상기 반영하는 단계는,
상기 임베딩 벡터를 기반으로 데이터 특성이 추론 처리 요구사항에 맞는 데이터를 선별하는 단계와,
상기 선별된 데이터에 대해 상기 기학습된 딥 러닝 모델의 파라미터를 재학습시키는 단계와,
상기 재학습시킨 딥 러닝 모델을 통해 데이터 추론을 수행하는 단계를 포함하는
딥 러닝 학습 방법. - 다중 분산 데이터베이스의 이종 데이터세트를 입력 받는 입력부와,
상기 이종 데이터세트를 이용한 딥 러닝 모델의 학습 또는 추론을 수행하는 프로세서부를 포함하고,
상기 프로세서부는,
상기 이종 데이터세트를 시계열 기준으로 병합하여 모델 학습을 위한 입력 스트림을 생성하고, 상기 입력 스트림에 대한 임베딩 벡터를 생성하며, 상기 임베딩 벡터를 상기 딥 러닝 모델의 학습과 기학습된 딥 러닝 모델을 통한 추론 중 적어도 하나에 적응적으로 반영하는
딥 러닝 학습 장치. - 제 5 항에 있어서,
상기 프로세서부는,
상기 임베딩 벡터를 통해 기울기를 계산하고, 상기 기울기를 이용하여 딥 러닝 모델의 파라미터를 학습시키는
딥 러닝 학습 장치. - 제 6 항에 있어서,
상기 프로세서부는,
상기 기울기를 계산할 때 패턴 기반의 정규화를 적용해 상기 기울기를 계산하고, 상기 정규화를 적용한 기울기를 이용하여 상기 딥 러닝 모델의 파라미터를 학습시키는
딥 러닝 학습 장치. - 제 5 항에 있어서,
상기 프로세서부는,
상기 임베딩 벡터를 기반으로 데이터 특성이 추론 처리 요구사항에 맞는 데이터를 선별하고, 상기 선별된 데이터에 대해 상기 기학습된 딥 러닝 모델의 파라미터를 재학습시키며, 상기 재학습시킨 딥 러닝 모델을 통해 데이터 추론을 수행하는
딥 러닝 학습 장치. - 컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,
상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면,
다중 분산 데이터베이스의 이종 데이터세트를 시계열 기준으로 병합하여 모델 학습을 위한 입력 스트림을 생성하는 단계와, 상기 입력 스트림에 대한 임베딩 벡터를 생성하는 단계와, 상기 임베딩 벡터를 딥 러닝 모델의 학습과 기학습된 딥 러닝 모델을 통한 추론 중 적어도 하나에 적응적으로 반영하는 단계를 포함하는 딥 러닝 학습 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 판독 가능한 기록매체. - 컴퓨터 판독 가능 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,
상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면,
다중 분산 데이터베이스의 이종 데이터세트를 시계열 기준으로 병합하여 모델 학습을 위한 입력 스트림을 생성하는 단계와, 상기 입력 스트림에 대한 임베딩 벡터를 생성하는 단계와, 상기 임베딩 벡터를 딥 러닝 모델의 학습과 기학습된 딥 러닝 모델을 통한 추론 중 적어도 하나에 적응적으로 반영하는 단계를 포함하는 딥 러닝 학습 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 프로그램.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR20200173719 | 2020-12-11 | ||
| KR1020200173719 | 2020-12-11 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20220083630A true KR20220083630A (ko) | 2022-06-20 |
| KR102799775B1 KR102799775B1 (ko) | 2025-04-25 |
Family
ID=82249991
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020210178067A Active KR102799775B1 (ko) | 2020-12-11 | 2021-12-13 | 다중 분산 데이터베이스 환경에서 이종 데이터세트의 임베딩 벡터를 이용한 딥 러닝 학습 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR102799775B1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102567566B1 (ko) * | 2022-11-30 | 2023-08-21 | 한국전자기술연구원 | 벡터공간 임베딩 기반의 데이터 편향성 절감 장치 및 그 방법 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019502212A (ja) * | 2016-01-14 | 2019-01-24 | 株式会社Preferred Networks | 時系列データ適合およびセンサ融合のシステム、方法、および装置 |
| KR20190113928A (ko) * | 2017-03-24 | 2019-10-08 | 구글 엘엘씨 | 강화 학습을 통한 디바이스 배치 최적화 |
| KR20200040652A (ko) * | 2018-10-10 | 2020-04-20 | 고려대학교 산학협력단 | 자연어 처리 시스템 및 자연어 처리에서의 단어 표현 방법 |
| JP2020518938A (ja) * | 2017-05-05 | 2020-06-25 | アリモ リミテッド ライアビリティ カンパニー | ニューラルネットワークを用いたシーケンスデータの分析 |
| KR20200083751A (ko) * | 2018-12-28 | 2020-07-09 | 강원대학교산학협력단 | 다차원 임베딩을 이용한 시퀀스 데이터 태깅 방법 및 장치 |
-
2021
- 2021-12-13 KR KR1020210178067A patent/KR102799775B1/ko active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019502212A (ja) * | 2016-01-14 | 2019-01-24 | 株式会社Preferred Networks | 時系列データ適合およびセンサ融合のシステム、方法、および装置 |
| KR20190113928A (ko) * | 2017-03-24 | 2019-10-08 | 구글 엘엘씨 | 강화 학습을 통한 디바이스 배치 최적화 |
| JP2020518938A (ja) * | 2017-05-05 | 2020-06-25 | アリモ リミテッド ライアビリティ カンパニー | ニューラルネットワークを用いたシーケンスデータの分析 |
| KR20200040652A (ko) * | 2018-10-10 | 2020-04-20 | 고려대학교 산학협력단 | 자연어 처리 시스템 및 자연어 처리에서의 단어 표현 방법 |
| KR20200083751A (ko) * | 2018-12-28 | 2020-07-09 | 강원대학교산학협력단 | 다차원 임베딩을 이용한 시퀀스 데이터 태깅 방법 및 장치 |
Non-Patent Citations (3)
| Title |
|---|
| (문헌 1) R. Polikar, L. Upda, S. S. Upda, and V. Honavar, "Learn++: An incremental learning algorithm for supervised neural networks," IEEE transactions on systems, man, and cybernetics, part C (applications and reviews), vol. 31, no. 4, pp. 497-508, 2001. |
| (문헌 2) O. Levy and Y. Goldberg, "Neural word embedding as implicit matrix factorization," in Advances in neural information processing systems, 2014, pp. 2177-2185. |
| (문헌 3) Y.-Y. Chang, F.-Y. Sun, Y.-H. Wu, and S.-D. Lin, "A memory-network based solution for multivariate time-series forecasting," arXiv preprint arXiv:1809.02105, 2018. |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102567566B1 (ko) * | 2022-11-30 | 2023-08-21 | 한국전자기술연구원 | 벡터공간 임베딩 기반의 데이터 편향성 절감 장치 및 그 방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR102799775B1 (ko) | 2025-04-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN119938816B (zh) | 基于知识图谱的公证智能问答客服方法及系统 | |
| KR20190098106A (ko) | 배치 정규화 레이어 트레이닝 방법 | |
| CN119783037A (zh) | 基于大数据的多源异构数据融合与处理方法 | |
| CN111612134A (zh) | 神经网络结构搜索方法、装置、电子设备及存储介质 | |
| Carreira-Perpinán | Model compression as constrained optimization, with application to neural nets. Part I: General framework | |
| Soyalp et al. | Improving text classification with transformer | |
| CN118780767A (zh) | 融合自然语言处理的项目评价评审方法及系统 | |
| US12271407B2 (en) | Systems and methods for implementing a virtual agent performing context and query transformations using unsupervised machine learning models | |
| US20240037335A1 (en) | Methods, systems, and media for bi-modal generation of natural languages and neural architectures | |
| Maaløe et al. | Semi-supervised generation with cluster-aware generative models | |
| US12131367B2 (en) | Intelligent product matching based on a natural language query | |
| US20240330693A1 (en) | Active learning for graph neural network based semantic schema alignment | |
| Al-Jebrni et al. | Predicting the next process event using convolutional neural networks | |
| US12380679B2 (en) | System and methods for active domain adaptation | |
| WO2025038558A1 (en) | Prompt routing system and method | |
| Szadkowski et al. | Continually trained life-long classification | |
| WO2023014373A1 (en) | System and methods for training machine-learned models for use in computing environments with limited resources | |
| CN113590953A (zh) | 一种基于深度学习的推荐算法库 | |
| CN115858929B (zh) | 一种基于深度学习的工业服务组件推荐方法 | |
| KR20250031042A (ko) | 자연어 입력과 대응되는 이미지를 추출하는 방법 | |
| KR102799775B1 (ko) | 다중 분산 데이터베이스 환경에서 이종 데이터세트의 임베딩 벡터를 이용한 딥 러닝 학습 | |
| KR20210119208A (ko) | 전문가 모사 모델 학습 방법 및 그 학습을 위한 장치 | |
| CN118210907B (zh) | 基于知识图谱向量化表示的智能问答模型构建方法 | |
| Anantha et al. | Learning to rank intents in voice assistants | |
| US12354167B2 (en) | Systems and methods for accuracy-enhanced processing of query data within a multi-digital agent architecture |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20211213 |
|
| PA0201 | Request for examination | ||
| PG1501 | Laying open of application | ||
| PN2301 | Change of applicant |
Patent event date: 20221101 Comment text: Notification of Change of Applicant Patent event code: PN23011R01D |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20240722 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20250331 |
|
| PG1601 | Publication of registration |