JP6811465B2 - 学習装置、学習方法、学習プログラム、自動制御装置、自動制御方法および自動制御プログラム - Google Patents
学習装置、学習方法、学習プログラム、自動制御装置、自動制御方法および自動制御プログラム Download PDFInfo
- Publication number
- JP6811465B2 JP6811465B2 JP2019098109A JP2019098109A JP6811465B2 JP 6811465 B2 JP6811465 B2 JP 6811465B2 JP 2019098109 A JP2019098109 A JP 2019098109A JP 2019098109 A JP2019098109 A JP 2019098109A JP 6811465 B2 JP6811465 B2 JP 6811465B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- value
- target device
- state value
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J13/00—Controls for manipulators
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/4155—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by programme execution, i.e. part programme or machine function execution, e.g. selection of a programme
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Automation & Control Theory (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Mechanical Engineering (AREA)
- Manufacturing & Machinery (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Robotics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Manipulator (AREA)
- Numerical Control (AREA)
- Testing And Monitoring For Control Systems (AREA)
Description
学習装置100は、図1に示すように、第1の学習モデル101、第2の学習モデル102、蓄積部103、取得部104、学習部105、手動制御部106、自動制御部107および表示制御部108を備えている。
図3は、学習装置100によるマニピュレータ10の自動制御の流れの一例を示すフローチャートである。なお、一部のステップは並行して、または、順序を替えて実行してもよい。事前(過去)に後述する手動学習または自動学習がなされた学習装置100は、マニピュレータ10(対象機器)を自動制御することができる。
ステップS3において、自動制御部107は、第2の学習モデル102から、カメラ13が撮像した撮像画像の特徴量を取得する。
図6は、学習装置100による手動学習の流れの一例を示すフローチャートである。なお、一部のステップは並行して、または、順序を替えて実行してもよい。
教師データは、状態値、特徴量および計測値の時系列データと、目標値に代えて、結果値と、を含む。すなわち、一態様において、教師データは、図4に示す入力パラメータの時系列データであって、設定された目標値が割り当てられていたパラメータの代わりに、取得部104が取得した結果値が固定値として入力されたデータである。
学習装置100は、図2に示す自動制御部107による制御の結果として蓄積部103に蓄積された状態値および特徴量の時系列データと、取得部104が取得した計測値および結果値とを用いて教師データを生成し、学習を行うことができる。これにより、動作精度を自動的に向上させることができる。つまり、学習装置100は、人の手を介さずに、学習モデルを自習することができる。したがって、手動学習の回数が少なく、手動学習により得られた対象機器の動作精度が所望の動作精度より低い場合であっても、自動学習により、対象機器の動作精度を所望の動作精度まで向上させることができる。言い換えると、少ない手動学習により、高い動作精度を得ることができる。結果として、手動学習を行う作業者の手間を減らすと共に、学習に要する時間を短くすることができる。
蓄積部103が状態値、特徴量および計測値を取得する間隔は、マニピュレータ10の制御に要する時間に近いことが好ましい。換言すれば、教師データに用いる状態値、特徴量および計測値のサンプリングレートは、マニピュレータ10の制御の処理レートに近いことが好ましい。
上記実施形態では、入力パラメータとして、撮像画像の特徴量が含まれているが、当該特徴量は含めなくともよい。また、入力パラメータとして、目標値(結果値)が含まれているが、目標値(結果値)は含めなくともよい。
学習装置100の制御ブロック(特に、蓄積部103、取得部104、学習部105、手動制御部106、自動制御部107および表示制御部108)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
本発明の態様1に係る学習装置は、動作中の対象機器の状態値および当該動作の計測値を経時的に取得して蓄積する蓄積部と、動作中の対象機器の状態値および当該動作の計測値が少なくとも入力され、当該対象機器の未来の状態値を予測する第1の学習モデルに、教師データを学習させる学習部と、を備え、前記教師データは、前記蓄積部に蓄積された前記状態値および前記計測値の時系列データを含む。
2 塩
10 マニピュレータ(対象機器)
11 関節
12 センサ
13 カメラ
14 計測装置
15 入力デバイス
16 ディスプレイ(表示部)
100 学習装置
101 第1の学習モデル
102 第2の学習モデル
103 蓄積部
104 取得部
105 学習部
106 手動制御部
107 自動制御部
108 表示制御部
200 現在の撮像画像
201 未来の撮像画像
Claims (19)
- 動作中の対象機器の状態値および当該動作の目的に関する計測値を経時的に取得して蓄積する蓄積部と、
動作中の対象機器の状態値および当該動作の目的に関する計測値が少なくとも入力され、当該対象機器の未来の状態値を予測する第1の学習モデルに、教師データを学習させる学習部と、を備え、
前記教師データは、前記蓄積部に蓄積された前記状態値および前記計測値の時系列データを含み、
前記動作が完了したときの計測値である結果値を取得する取得部をさらに備え、
前記第1の学習モデルの入力データは、前記対象機器の動作の目標値をさらに含み、
前記教師データは、さらに、前記目標値に代えて、前記取得部が取得した前記結果値を含むことを特徴とする学習装置。 - 外部からの指示に応じて前記対象機器を制御する手動制御部をさらに備え、
前記学習部は、前記手動制御部による制御の結果として前記蓄積部に蓄積された前記状態値および前記計測値の時系列データを少なくとも用いて学習を行うことを特徴とする請求項1に記載の学習装置。 - 動作中の前記対象機器の状態値および前記動作の目的に関する計測値を前記第1の学習モデルに入力し、前記第1の学習モデルが予測した前記未来の状態値に前記対象機器の状態値を近づけるように前記対象機器を制御する自動制御部をさらに備えていることを特徴とする請求項1または2に記載の学習装置。
- 前記学習部は、前記自動制御部による制御の結果として前記蓄積部に蓄積された前記状態値および前記計測値の時系列データを少なくとも用いて、学習を行うことを特徴とする請求項3に記載の学習装置。
- 前記自動制御部は、前記動作を完了させるまでに掛かった時間に基づいて、当該動作の結果として前記蓄積部に蓄積された前記状態値および前記計測値の時系列データを少なくとも用いた学習を前記学習部に行わせるか否かを判定することを特徴とする請求項4に記載の学習装置。
- 前記自動制御部は、前記状態値または前記計測値を取得してから前記対象機器を制御するまでに掛かった時間を測定し、当該時間に基づいて、前記蓄積部が、前記状態値または前記計測値を取得する間隔を調整することを特徴とする請求項3〜5のいずれか一項に記載の学習装置。
- 前記蓄積部は、さらに、前記対象機器の動作の目的物を撮像した撮像画像の特徴量を経時的に取得して蓄積し、
前記第1の学習モデルには、さらに、前記撮像画像の特徴量が入力され、
前記教師データは、さらに、前記蓄積部に蓄積された前記特徴量の時系列データを含むことを特徴とする請求項1〜6のいずれか一項に記載の学習装置。 - 前記蓄積部は、さらに、前記撮像画像を蓄積し、
前記学習部は、入力画像と出力画像とが一致するように深層学習される第2の学習モデルに、前記蓄積部に蓄積された前記撮像画像を学習させ、
前記撮像画像の特徴量は、当該撮像画像が入力された前記第2の学習モデルから得られることを特徴とする請求項7に記載の学習装置。 - 前記第1の学習モデルは、さらに、未来の撮像画像の特徴量を予測し、
前記第1の学習モデルが予測した前記未来の撮像画像の特徴量から復元した前記未来の撮像画像と、前記目的物を撮像した撮像画像とを表示部に表示させる表示制御部をさらに備えていることを特徴とする請求項7または8に記載の学習装置。 - 前記教師データは、複数次元のパラメータの時系列データを含み、次元毎に前記パラメータが正規化されていることを特徴とする請求項1〜9のいずれか一項に記載の学習装置。
- 前記第1の学習モデルは、RNNであることを特徴とする請求項1〜10のいずれか一項に記載の学習装置。
- 前記対象機器は、関節を有するマニピュレータであり、
前記状態値は、前記関節の状態値を含むことを特徴とする請求項1〜11のいずれか一項に記載の学習装置。 - 動作中の対象機器の状態値および当該動作の目的に関する計測値を経時的に取得して蓄積する蓄積工程と、
動作中の対象機器の状態値および当該動作の目的に関する計測値が少なくとも入力され、当該対象機器の未来の状態値を予測する第1の学習モデルに、教師データを学習させる学習工程と、を含み、
前記教師データは、前記蓄積工程で蓄積された前記状態値および前記計測値の時系列データを含み、
前記動作が完了したときの計測値である結果値を取得する取得工程をさらに含み、
前記第1の学習モデルの入力データは、前記対象機器の動作の目標値をさらに含み、
前記教師データは、さらに、前記目標値に代えて、前記取得工程において取得した前記結果値を含むことを特徴とする学習方法。 - 請求項1に記載の学習装置としてコンピュータを機能させるための学習プログラム。
- 請求項14に記載の学習プログラムを記録したコンピュータ読み取り可能な記録媒体。
- 動作中の対象機器の状態値および当該動作の目的に関する計測値が少なくとも入力され、当該対象機器の未来の状態値を予測する第1の学習モデルと、
少なくとも動作中の前記対象機器の状態値および当該動作の目的に関する計測値を前記第1の学習モデルに入力し、前記第1の学習モデルが予測した前記未来の状態値に前記対象機器の状態値を近づけるように前記対象機器を制御する自動制御部と、を備え、
前記第1の学習モデルは、過去の前記対象機器の前記状態値および前記計測値の時系列データを含む教師データを学習しており、
前記第1の学習モデルの入力データは、前記対象機器の動作の目標値をさらに含み、
前記教師データは、さらに、前記目標値に代えて、過去の前記対象機器の前記動作が完了したときの計測値である結果値を含むことを特徴とする自動制御装置。 - 動作中の対象機器の状態値および当該動作の目的に関する計測値が少なくとも入力され、当該対象機器の未来の状態値を予測する第1の学習モデルに、少なくとも動作中の前記対象機器の状態値および当該動作の目的に関する計測値を入力し、前記第1の学習モデルが予測した前記未来の状態値に前記対象機器の状態値を近づけるように前記対象機器を制御する自動制御工程を含み、
前記第1の学習モデルは、過去の前記対象機器の前記状態値および前記計測値の時系列データを含む教師データを学習しており、
前記第1の学習モデルの入力データは、前記対象機器の動作の目標値をさらに含み、
前記教師データは、さらに、前記目標値に代えて、過去の前記対象機器の前記動作が完了したときの計測値である結果値を含むことを特徴とする自動制御方法。 - 請求項16に記載の自動制御装置としてコンピュータを機能させるための自動制御プログラム。
- 請求項18に記載の自動制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019098109A JP6811465B2 (ja) | 2019-05-24 | 2019-05-24 | 学習装置、学習方法、学習プログラム、自動制御装置、自動制御方法および自動制御プログラム |
| PCT/JP2020/014981 WO2020241037A1 (ja) | 2019-05-24 | 2020-04-01 | 学習装置、学習方法、学習プログラム、自動制御装置、自動制御方法および自動制御プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019098109A JP6811465B2 (ja) | 2019-05-24 | 2019-05-24 | 学習装置、学習方法、学習プログラム、自動制御装置、自動制御方法および自動制御プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020194242A JP2020194242A (ja) | 2020-12-03 |
| JP6811465B2 true JP6811465B2 (ja) | 2021-01-13 |
Family
ID=73547509
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019098109A Active JP6811465B2 (ja) | 2019-05-24 | 2019-05-24 | 学習装置、学習方法、学習プログラム、自動制御装置、自動制御方法および自動制御プログラム |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP6811465B2 (ja) |
| WO (1) | WO2020241037A1 (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022145213A1 (ja) * | 2020-12-28 | 2022-07-07 | ソニーグループ株式会社 | 制御装置、制御システム及び制御方法 |
| US20240033911A1 (en) * | 2020-12-28 | 2024-02-01 | Sony Group Corporation | Control system and control method |
| JP6955733B1 (ja) * | 2021-02-17 | 2021-10-27 | 株式会社エクサウィザーズ | 情報処理装置、情報処理方法、及びプログラム |
| JP7676911B2 (ja) * | 2021-04-27 | 2025-05-15 | マツダ株式会社 | 解析支援方法、該プログラムおよび解析支援装置 |
| JP7237382B1 (ja) * | 2021-12-24 | 2023-03-13 | 知能技術株式会社 | 画像処理装置、画像処理方法、及び画像処理プログラム |
| US20230271319A1 (en) * | 2022-02-28 | 2023-08-31 | Denso Wave Incorporated | Method of generating a learning model for transferring fluid from one container to another by controlling robot arm based on a machine-learned learning model, and a method and system for weighing the fluid |
| CN115446867B (zh) * | 2022-09-30 | 2024-09-17 | 山东大学 | 一种基于数字孪生技术的工业机械臂控制方法及系统 |
| JP2024084012A (ja) * | 2022-12-12 | 2024-06-24 | オムロン株式会社 | ロボットシステム |
| JP2025020634A (ja) * | 2023-07-31 | 2025-02-13 | オムロン株式会社 | 制御装置、学習済みモデル生成装置、方法、及びプログラム |
| JP2025042336A (ja) | 2023-09-14 | 2025-03-27 | 株式会社デンソー | データ収集システム、自動化作業システム、データ収集プログラム及び自動化作業プログラム生成プログラム |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11272305A (ja) * | 1998-03-23 | 1999-10-08 | Toshiba Corp | プラント制御装置 |
| JP6692740B2 (ja) * | 2016-12-20 | 2020-05-13 | ヤフー株式会社 | 選択装置、選択方法及び選択プログラム |
| JP6886869B2 (ja) * | 2017-06-09 | 2021-06-16 | 川崎重工業株式会社 | 動作予測システム及び動作予測方法 |
| JP6693919B2 (ja) * | 2017-08-07 | 2020-05-13 | ファナック株式会社 | 制御装置及び機械学習装置 |
-
2019
- 2019-05-24 JP JP2019098109A patent/JP6811465B2/ja active Active
-
2020
- 2020-04-01 WO PCT/JP2020/014981 patent/WO2020241037A1/ja not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| WO2020241037A1 (ja) | 2020-12-03 |
| JP2020194242A (ja) | 2020-12-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6811465B2 (ja) | 学習装置、学習方法、学習プログラム、自動制御装置、自動制御方法および自動制御プログラム | |
| JP6810087B2 (ja) | 機械学習装置、機械学習装置を用いたロボット制御装置及びロボットビジョンシステム、並びに機械学習方法 | |
| JP6676030B2 (ja) | 把持システム、学習装置、把持方法、及び、モデルの製造方法 | |
| EP1864764B1 (en) | Robot simulation apparatus | |
| JP7458741B2 (ja) | ロボット制御装置及びその制御方法及びプログラム | |
| JP6680750B2 (ja) | 制御装置及び機械学習装置 | |
| US10807234B2 (en) | Component supply device and machine learning device | |
| JP2019166626A (ja) | 制御装置及び機械学習装置 | |
| US11059180B2 (en) | Control device and machine learning device | |
| JP2011110620A (ja) | ロボットの動作を制御する方法およびロボットシステム | |
| JP2022543926A (ja) | ロボットシステムのためのデリバティブフリーモデル学習のシステムおよび設計 | |
| US12290928B2 (en) | Systems and methods for flexible robotic manipulation by fast online load estimation | |
| CN113412178A (zh) | 机器人控制装置、机器人系统以及机器人控制方法 | |
| CN112638596A (zh) | 自主学习型机器人装置以及自主学习型机器人装置的动作生成方法 | |
| Delgado et al. | Tactile control based on Gaussian images and its application in bi-manual manipulation of deformable objects | |
| JP2021501433A (ja) | ターゲットシステム用制御システムの生成 | |
| JP7376318B2 (ja) | アノテーション装置 | |
| CN119347753B (zh) | 确定控制策略模型的方法及装置以及用于控制末端执行器的方法及装置 | |
| CN115958595B (zh) | 机械臂引导方法、装置、计算机设备和存储介质 | |
| Thompson et al. | Identification of unknown object properties based on tactile motion sequence using 2-finger gripper robot | |
| JP2020097072A (ja) | 制御装置、及び学習装置 | |
| CN118265596A (zh) | 机器人控制装置、机器人系统以及机器人控制方法 | |
| CN114454176A (zh) | 机器人的控制方法、控制装置、机器人和存储介质 | |
| US20250065493A1 (en) | Method and system for dexterous manipulation by a robot | |
| CN120155933A (zh) | 一种抓取策略模型的训练、抓取方法、装置及系统 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200107 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200107 |
|
| A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200108 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200626 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200707 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200819 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200908 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201105 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201201 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201207 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6811465 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |