JP7073171B2 - 学習装置、学習方法及びプログラム - Google Patents
学習装置、学習方法及びプログラム Download PDFInfo
- Publication number
- JP7073171B2 JP7073171B2 JP2018071012A JP2018071012A JP7073171B2 JP 7073171 B2 JP7073171 B2 JP 7073171B2 JP 2018071012 A JP2018071012 A JP 2018071012A JP 2018071012 A JP2018071012 A JP 2018071012A JP 7073171 B2 JP7073171 B2 JP 7073171B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- mini
- batch
- configuration pattern
- configuration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2115—Selection of the most significant subset of features by evaluating different subsets according to an optimisation criterion, e.g. class separability, forward selection or backward elimination
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Description
(第1の実施形態)
第1の実施形態に係る学習装置は、ミニバッチ学習を行う多層ニューラルネットワークにおいて、ミニバッチに含まれる学習データの組み合わせを適切に設定することで、効率よく学習を行う。図1は、第1の実施形態に係る学習装置100のハードウェア構成図である。学習装置100は、CPU101と、ROM102と、RAM103と、HDD104と、表示部105と、入力部106と、通信部107とを有している。CPU101は、ROM102に記憶された制御プログラムを読み出して各種処理を実行する。RAM103は、CPU101の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD104は、各種データや各種プログラム等を記憶する。表示部105は、各種情報を表示する。入力部106は、キーボードやマウスを有し、ユーザによる各種操作を受け付ける。通信部107は、ネットワークを介して外部装置との通信処理を行う。
次に、第2の実施形態に係る学習装置100について、第1の実施形態に係る学習装置100と異なる点を主に説明する。第2の実施形態に係る学習装置100は、学習セットの学習データを選択する際に、学習効果の高い学習データを優先的に選択することで、効率よく学習を行う。第2の実施形態においては、学習データは、評価スコアを含んでいる。学習データの評価スコアは、初期状態においてはすべて一律の値(初期値)であるものとする。
次に、第3の実施形態に係る学習装置100について、他の実施形態と異なる点を主に説明する。第3の実施形態に係る学習装置100は、ミニバッチの一部を評価セットとし、評価セットの評価スコアに基づいて構成パターンを選択するのに替えて、構成パターンを決定するエージェントを別途有するものとする。該エージェントによって構成パターンを決定することで、ミニバッチに含まれるすべての学習データを学習に使いつつ、適切な構成のミニバッチを用いて効率よく学習を行うことができる。
V Mnih, et al., "Human-level control through deep reinforcement learning", Nature 518 (7540), 529-533
202 パターン生成部
204 パターン決定部
206 ミニバッチ生成部
207 学習部
Claims (9)
- 多層ニューラルネットワークのミニバッチ学習を行う学習装置であって、
学習データのクラス情報に基づいて生成された構成パターンのミニバッチを用いて、ニューラルネットワークの学習を行う学習手段と、
前記学習手段により既に得られている学習結果に基づいて、次の学習に利用する構成パターンを決定する決定手段と
を有し、
前記学習手段は、前記決定手段により決定された構成パターンのミニバッチを用いて、学習を行うことを特徴とする学習装置。 - 複数の構成パターンを生成する生成手段をさらに有し、
前記決定手段は、前記学習結果に基づいて、前記生成手段により生成された複数の構成パターンのうち一の構成パターンを、次の学習に利用する構成パターンとして決定することを特徴とする請求項1に記載の学習装置。 - 前記生成手段により生成された複数の構成パターンが前記決定手段により次の学習に利用する構成パターンとして決定される確率を、前記学習結果に基づいて変更する第1の変更手段をさらに有し、
前記決定手段は、前記第1の変更手段により変更された、複数の構成パターンそれぞれの確率に従って、次の学習に利用する構成パターンを決定することを特徴とする請求項2に記載の学習装置。 - 前記ミニバッチを構成する学習データと異なるデータを用いて、前記学習手段による学習結果を評価する評価手段をさらに有し、
前記決定手段は、前記評価手段により得られた学習結果の評価に基づいて、次の学習に利用する構成パターンを決定することを特徴とする請求項2又は3に記載の学習装置。 - 前記学習結果に基づいて、前記決定手段により決定された前記構成パターンに対応した、学習データを選択する選択手段をさらに有し、
前記学習手段は、前記選択手段により選択された学習データを含む前記ミニバッチを用いて前記学習を行うことを特徴とする請求項2乃至4の何れか1項に記載の学習装置。 - 前記学習データが前記選択手段により選択される確率を、前記学習結果に基づいて変更する第2の変更手段を更に有し、
前記選択手段は、前記第2の変更手段により変更された、前記学習データそれぞれの確率に従って、構成パターンに対応した学習データを選択することを特徴とする請求項5に記載の学習装置。 - 前記学習手段は、ニューラルネットワークの強化学習を行い、
前記決定手段は、前記学習手段により既に得られている複数の学習結果に基づいて、次の学習に利用する構成パターンを決定することを特徴とする請求項1に記載の学習装置。 - 多層ニューラルネットワークのミニバッチ学習を行う学習装置による学習方法であって、
学習データのクラス情報に基づいて生成された構成パターンのミニバッチを用いて、ニューラルネットワークの学習を行う学習ステップと、
前記学習ステップにおいて既に得られている学習結果に基づいて、次の学習に利用する構成パターンを決定する決定ステップと
を含み、
前記学習ステップでは、前記決定ステップにおいて決定された構成パターンのミニバッチを用いて、学習を行うことを特徴とする学習方法。 - コンピュータを、請求項1乃至7の何れか1項に記載の学習装置の各手段として機能させるためのプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018071012A JP7073171B2 (ja) | 2018-04-02 | 2018-04-02 | 学習装置、学習方法及びプログラム |
| US16/365,482 US20190303714A1 (en) | 2018-04-02 | 2019-03-26 | Learning apparatus and method therefor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018071012A JP7073171B2 (ja) | 2018-04-02 | 2018-04-02 | 学習装置、学習方法及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019185121A JP2019185121A (ja) | 2019-10-24 |
| JP7073171B2 true JP7073171B2 (ja) | 2022-05-23 |
Family
ID=68054460
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018071012A Active JP7073171B2 (ja) | 2018-04-02 | 2018-04-02 | 学習装置、学習方法及びプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US20190303714A1 (ja) |
| JP (1) | JP7073171B2 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7448281B2 (ja) * | 2020-03-27 | 2024-03-12 | 日本電気通信システム株式会社 | 二次元マーカの認識装置、方法、プログラム及びシステム |
| JP7610951B2 (ja) * | 2020-10-12 | 2025-01-09 | 大成建設株式会社 | 学習装置、学習方法および判定装置 |
| JP7547956B2 (ja) * | 2020-11-25 | 2024-09-10 | 富士通株式会社 | 修正対象エッジ決定方法および修正対象エッジ決定プログラム |
| KR102852718B1 (ko) * | 2021-05-04 | 2025-08-29 | 주식회사 에스아이에이 | 객체 검출 방법 |
| US20230195743A1 (en) * | 2021-12-22 | 2023-06-22 | ZenDesk, Inc. | Balancing time-constrained data transformation workflows |
| JP2024096543A (ja) * | 2023-01-04 | 2024-07-17 | 株式会社東芝 | プログラム、情報処理装置および情報処理方法 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013161298A (ja) | 2012-02-06 | 2013-08-19 | Nippon Steel & Sumitomo Metal | 分類器作成装置、分類器作成方法、及びコンピュータプログラム |
| US20170206457A1 (en) | 2016-01-20 | 2017-07-20 | Adobe Systems Incorporated | Digital Content Interaction Prediction and Training that Addresses Imbalanced Classes |
-
2018
- 2018-04-02 JP JP2018071012A patent/JP7073171B2/ja active Active
-
2019
- 2019-03-26 US US16/365,482 patent/US20190303714A1/en not_active Abandoned
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013161298A (ja) | 2012-02-06 | 2013-08-19 | Nippon Steel & Sumitomo Metal | 分類器作成装置、分類器作成方法、及びコンピュータプログラム |
| US20170206457A1 (en) | 2016-01-20 | 2017-07-20 | Adobe Systems Incorporated | Digital Content Interaction Prediction and Training that Addresses Imbalanced Classes |
Non-Patent Citations (1)
| Title |
|---|
| 山岡 忠夫,将棋AIで学ぶディープラーニング,初版,日本,株式会社マイナビ出版,2018年03月10日,pp.44-45,ISBN: 978-4-8399-6541-9 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20190303714A1 (en) | 2019-10-03 |
| JP2019185121A (ja) | 2019-10-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7073171B2 (ja) | 学習装置、学習方法及びプログラム | |
| KR102641116B1 (ko) | 데이터 증강에 기초한 인식 모델 트레이닝 방법 및 장치, 이미지 인식 방법 및 장치 | |
| CN112784954B (zh) | 确定神经网络的方法和装置 | |
| US9111375B2 (en) | Evaluation of three-dimensional scenes using two-dimensional representations | |
| KR20210030063A (ko) | 준지도 학습을 기반으로 한 이미지 분류를 위한 적대적 이미지 생성 모델 구축 시스템 및 방법 | |
| Abd-Alsabour | A review on evolutionary feature selection | |
| JP6865889B2 (ja) | 学習装置、方法及びプログラム | |
| CN113994341A (zh) | 面部行为分析 | |
| CN111783997B (zh) | 一种数据处理方法、装置及设备 | |
| CN109522970A (zh) | 图像分类方法、装置及系统 | |
| CN111127390A (zh) | 基于迁移学习的x射线影像处理方法及系统 | |
| JPWO2019102984A1 (ja) | 学習装置、識別装置及びプログラム | |
| KR20200082490A (ko) | 기계 학습 데이터 선택 방법 및 장치 | |
| CN112766496A (zh) | 基于强化学习的深度学习模型安全性保障压缩方法与装置 | |
| CN114328904B (zh) | 内容处理方法、装置、计算机设备和存储介质 | |
| JP2019079227A (ja) | 状態遷移規則獲得装置、行動選択学習装置、行動選択装置、状態遷移規則獲得方法、行動選択方法、およびプログラム | |
| WO2024222444A1 (zh) | 半监督目标检测模型的训练、目标检测方法及装置 | |
| CN112053378A (zh) | 一种改进的pso优化pcnn模型的图像分割算法 | |
| CN113222100A (zh) | 神经网络模型的训练方法和装置 | |
| CN119631077A (zh) | 利用受约束样例的对抗性语言模仿 | |
| CN114332594A (zh) | 一种基于ddqn的触觉材料不平衡数据的分类方法 | |
| CN114445656A (zh) | 多标签模型处理方法、装置、电子设备及存储介质 | |
| JP6993250B2 (ja) | コンテンツ特徴量抽出装置、方法、及びプログラム | |
| JP2020107185A (ja) | 画像認識装置、画像認識方法及びプログラム | |
| KR20180082680A (ko) | 분류기를 학습시키는 방법 및 이를 이용한 예측 분류 장치 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210329 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220309 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220412 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220511 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 7073171 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |