JP2004118658A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2004118658A5 JP2004118658A5 JP2002282987A JP2002282987A JP2004118658A5 JP 2004118658 A5 JP2004118658 A5 JP 2004118658A5 JP 2002282987 A JP2002282987 A JP 2002282987A JP 2002282987 A JP2002282987 A JP 2002282987A JP 2004118658 A5 JP2004118658 A5 JP 2004118658A5
- Authority
- JP
- Japan
- Prior art keywords
- physical system
- local model
- approximation
- local
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006870 function Effects 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000012886 linear function Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims 4
- 238000004590 computer program Methods 0.000 claims 3
- 238000011478 gradient descent method Methods 0.000 claims 2
- 238000005457 optimization Methods 0.000 claims 2
- 230000003044 adaptive effect Effects 0.000 description 19
- 238000013528 artificial neural network Methods 0.000 description 18
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010230 functional analysis Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005183 dynamical system Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
Description
理想的なアルゴリズムは、入力データ内の冗長性による数値上の問題を避け、入力値の異常を排除し、学習中の更新処理の計算の複雑さをおさえながらデータ効率を高く維持し、高次元空間での学習をリアルタイムで行なえるようにし、当然のことながら、正確な関数近似が可能でかつ十分に一般化可能である必要がある。さらに、学習制御において関数近似を行なう上で特に問題となるのは、多くの場合、動作範囲が未知であり、上限でしか規定されないということである。そのように動作範囲を大きく見積もった場合に関数近似を行なう場合、多くの学習パラメータを割当てなければならないので計算コストが高くなる。さらにそれらのパラメータが学習データによる制約を適切に受けていないと、ノイズに対し、オーバーフィッティングしてしまうというおそれもある。一般に、推定すべき関数の複雑さが未知である場合に、学習パラメータの数としていくつを選べばよいかを決定するのは難しく、特に学習をオンラインで行なう場合には困難な問題である。 The ideal algorithm avoids numerical problems due to redundancy in the input data, eliminates anomalies in the input values, maintains high data efficiency while keeping the computational complexity of the update process during learning, high dimensional In order to be able to perform learning in space in real time, it is of course necessary that accurate function approximation be possible and sufficiently generalizable. Furthermore, what is particularly problematic in performing function approximation in learning control is that in many cases the operating range is unknown and can only be defined at the upper limit. When performing function approximation if the estimated increased so the operating range, the computational cost because it must assign a number of learning parameters increases. Furthermore, if these parameters are not properly restricted by the learning data, there is a risk that they will overfit against noise. In general, when the complexity of the function to be estimated is unknown, it is difficult to determine how many to choose as the number of learning parameters, especially when learning is performed online.
パラメータθkを、(xi,yi)または(xi,ei)の形式で与えられるデータから近似する必要がある。ここでyiは学習のターゲットであり、eiは推定誤差ep,I=f(xi)-^f(xi)を近似する誤差信号であって、平均値が0の雑音を含む。 The parameter θ k needs to be approximated from the data given in the form (x i , y i ) or (x i , e i ). Here, y i is a target of learning, and e i is an error signal that approximates the estimation error e p, I = f (x i )-^ f (x i ), and includes noise with an average value of 0. .
にしたがって当該局所モデルの学習パラメータの近似^θkを算出するステップと、所定の式により定められる、学習データを表わす関数値yと関数近似^yとの間で定められる誤差指標を最小化することにより、距離メトリックの各々を最適化するステップとを含んでもよい。
Calculating an approximation ^ θ k of the learning parameter of the local model according to and minimizing an error index defined between the function value y representing the learning data and the function approximation ^ y determined by a predetermined equation And D. optimizing each of the distance metrics.
この発明のさらに他の局面にかかる物理系の制御装置は、物理系の動力学を記述する非線形関数を、線形の局所モデルに重みを付けて加算することにより得られる関数近似で近似することによって物理系を制御する物理系の制御装置である。関数近似を構成する局所モデルの構造と、それぞれの重みとはそれぞれ所定の学習パラメータにより定められる。この装置は、関数近似の初期構造を規定するための初期化手段と、物理系の実際の状態を表わす状態データを受信するための受信手段と、状態データに基づいて、物理系の目標軌跡と実際の軌跡との間のトラッキング誤差、および状態データと関数近似との間の近似誤差に基づいて、各局所モデルごとに独立に所定の誤差指標を最小化するように各局所モデルの学習パラメータを更新することで関数近似を更新するための更新手段と、更新された関数近似を用い、制御系の制御則にしたがって制御変数の計算を行なうための計算手段と、計算された制御変数を物理系に出力するための出力手段と、受信手段、更新手段、計算手段および出力手段が繰返し動作するよう制御するための制御手段とを含む。 A controller of a physical system according to still another aspect of the present invention approximates the non-linear function describing the dynamics of the physical system by a function approximation obtained by weighting and adding a linear local model. It is a control device of a physical system that controls the physical system. The structure of the local model constituting the function approximation and the respective weights are determined by predetermined learning parameters. This apparatus comprises: initialization means for defining an initial structure of function approximation; receiving means for receiving state data representing an actual state of the physical system; and a target trajectory of the physical system based on the state data Based on the tracking error between the actual trajectory and the approximation error between the state data and the function approximation, learning parameters of each local model are minimized so as to minimize a predetermined error index independently for each local model. Updating means for updating function approximation by updating, calculating means for calculating control variables according to the control law of the control system using the updated function approximation, and the calculated control variables as a physical system And output means for outputting data, and control means for controlling the receiving means, the updating means, the calculating means, and the output means to operate repeatedly.
にしたがって当該局所モデルの学習パラメータの近似^θkを算出するための手段と、所定の式により定められる、学習データを表わす関数値yと関数近似^yとの間で定められる誤差指標を最小化することにより、距離メトリックの各々を最適化するための最適化手段とを含む。
Means for calculating the approximation ^ θ k of the learning parameter of the local model according to and the error index defined between the function value y representing the learning data and the function approximation ^ y determined by a predetermined equation And optimizing means for optimizing each of the distance metrics.
図5に、本実施の形態にかかる非線形制御を行なうコントローラ60のブロック図を、コントローラ60に対して制御対象となるロボットなどの物理系からの制御変数の入力を行なうためのセンサ群62A−62Nと、コントローラ60によって制御されて動作するアクチュエータ群64A−64Mとともに示す。コントローラ60は、センサ群62A−62Nからの入力を受ける入力ポート70と、アクチュエータ群64A−64Mが接続される出力ポート72と、入力ポート70および出力ポート72に接続されるCPU(Central Processing Unit)74と、いずれもCPU74に接続されるROM(Read−Only Memory)76、RAM(Random Access Memory)78、ネットワークボード82、およびメモリリーダ80とを含む。ネットワークボード82は外部のネットワーク92に接続される。メモリリーダ80には、集積回路からなるメモリカード90を着脱可能であり、メモリカード90に格納されたデータおよびプログラムをCPU74に供給し、CPU74からのデータを格納することが可能である。 FIG. 5 is a block diagram of the controller 60 that performs non-linear control according to the present embodiment, and a sensor group 62A-62N for inputting control variables from a physical system such as a robot to be controlled to the controller 60. And the actuator group 64A-64M controlled and operated by the controller 60. The controller 60 has a CPU (Central Processing Unit) connected to the input port 70 receiving the input from the sensor group 62A to 62N, the output port 72 to which the actuator group 64A to 64M is connected, and the input port 70 and the output port 72 74 includes a ROM (Read-Only Memory) 76, a RAM (Random Access Memory) 78, a network board 82, and a memory reader 80, all of which are connected to the CPU 74. The network board 82 is connected to an external network 92. A memory card 90 made of an integrated circuit is removable from the memory reader 80. The data and program stored in the memory card 90 can be supplied to the CPU 74, and data from the CPU 74 can be stored.
図9に、図7のステップ122およびステップ124の一例として局所モデルを追加する場合のプログラムのフローチャートを示す。図9を参照して、まずステップ170であるデータ点xについて計算された全ての重みwkがあるしきい値より小さいか否かが判定される。この判定結果がYESであれば、このデータ点の存在がどの局所モデルにも十分に反映されていないということなので、ステップ172で新規な局所モデルを追加する。この場合の局所モデルの中心c kの初期値はxに設定される。その幅には適当な初期値が設定される。たとえば隣接する局所モデルの幅などを初期値に設定するとよい。これは、隣接する局所モデルは、真の関数の隣接する部分に対応しているので、そこでの真の関数の曲率にもそれほど大きな違いはないだろうという推定に基づく。もっとも、ここで新規に追加する局所モデルは以後の更新処理で調整されていくため、上のように幅を選ぶことは必須ではない。ただし、上のように選ぶことにより局所モデルの幅が早期に最適な値に調整されるという効果がある。 FIG. 9 shows a flowchart of a program for adding a local model as an example of steps 122 and 124 of FIG. Referring to FIG. 9, whether initially less than all of the weights w k is the threshold calculated for the data points x is the step 170 is determined. If the determination result is YES, it means that the presence of this data point is not sufficiently reflected in any local model, so a new local model is added in step 172. The initial value of the center c k of the local model in this case is set to x . An appropriate initial value is set to the width. For example, the width of an adjacent local model may be set to an initial value. This is based on the assumption that adjacent local models correspond to adjacent parts of the true function, so the curvature of the true function there will not be much different. However, since the local model to be newly added here is adjusted in the subsequent update processing, it is not essential to select the width as described above. However, selecting as above has an effect that the width of the local model is adjusted to the optimum value at an early stage.
再び図6を参照して、ステップ106で計算に使用される制御則の例は以下の
形のものである。
Referring again to FIG. 6 , an example of a control law used in the calculations at step 106 is of the form:
図12は、N(0,0.01)のガウスノイズを測定値に加えたときの非適応的PDコントローラによるトラッキング誤差230と、Γk=10Iおよび250Iのトラッキング誤差ベースの適応コントローラのトラッキング誤差232および234と、本実施の形態のRFWR複合適応コントローラによるトラッキング誤差236とを比較して示す。図12に示すように、Γk=250Iのトラッキング誤差ベースの適応コントローラの性能は、ガウスノイズの存在によって大きく低下する。それに対し本実施の形態にかかるRFWR複合適応コントローラは安定でかつ高速な学習を実現していることが分かる。 FIG. 12 shows tracking error 230 by the non-adaptive PD controller when N (0, 0.01) Gaussian noise is added to the measured value, and tracking by the tracking error based adaptive controller of Γ k = 10 I and 250 I The errors 232 and 234 and the tracking error 236 by the RFWR complex adaptive controller of the present embodiment are compared and shown. As shown in FIG. 12, the performance of the tracking error based adaptive controller at Γ k = 250 I is greatly degraded by the presence of Gaussian noise. On the other hand, it can be seen that the RFWR complex adaptive controller according to the present embodiment realizes stable and fast learning.
【符号の説明】
20 目標軌跡、22 実際の軌跡、24 トラッキング誤差、26,40 真の関数、28 関数近似、30 近似誤差、32 カーネル関数、42,44,46 カーネル直径の範囲、42C トレーニング点、52,54,56 局所近似線形関数、60 コントローラ、74 CPU、76 ROM、78 RAM、80 メモリリーダ、82 ネットワークボード、90 メモリカード、92 ネットワーク
[Description of the code]
20 target trajectory, 22 actual trajectory, 24 tracking error, 26, 40 true function, 28 function approximation, 30 approximation error, 32 kernel function, 42, 44, 46 kernel diameter range, 42C training point , 52, 54, 56 local approximation linear function, 60 controller, 74 CPU, 76 ROM, 78 RAM, 80 memory reader, 82 network board, 90 memory card, 92 network
Claims (20)
前記関数近似の初期構造を規定するステップと、
前記物理系の実際の状態を表わす状態データを受信するステップと、
前記状態データに基づいて、前記物理系の目標軌跡と実際の軌跡との間のトラッキング誤差、および前記状態データと前記関数近似との間の近似誤差に基づいて、各局所モデルごとに独立に所定の誤差指標を最小化するように各局所モデルの学習パラメータを更新することで前記関数近似を更新するステップと、
更新された前記関数近似を用い、前記制御系の制御則にしたがって制御変数の計算を行なうステップと、
計算された前記制御変数を前記物理系に出力するステップと、
前記受信するステップ、更新するステップ、計算を行なうステップ、および出力するステップを繰返し行なうステップとを含む、物理系の制御方法。A control method of a physical system for controlling a physical system by approximating a non-linear function describing the dynamics of the physical system by a function approximation obtained by weighting and adding a linear local model. The structure of the local model making up the approximation and the respective weights are determined by predetermined learning parameters,
Defining an initial structure of the function approximation;
Receiving state data representing an actual state of the physical system;
Based on the state data, it is determined independently for each local model based on the tracking error between the target trajectory of the physical system and the actual trajectory, and the approximation error between the state data and the function approximation. Updating the function approximation by updating the learning parameters of each local model so as to minimize the error index of
Calculating the control variable according to the control law of the control system using the updated function approximation;
Outputting the calculated control variable to the physical system;
A control method of a physical system, comprising the steps of receiving, updating, performing calculation, and repeatedly performing outputting.
wkは所定のカーネル関数により表わされる重み、
で表わされる、請求項1に記載の物理系の制御方法。The function approximation ^ y is
w k is a weight represented by a predetermined kernel function,
The control method of the physical system according to claim 1, represented by
既存の局所モデルの各々について、前記状態データに基づいて、前記物理系の目標軌跡と実際の軌跡との間のトラッキング誤差、および前記状態データと前記関数近似との間の近似誤差に基づいて、所定の誤差指標を最小化するように学習パラメータを更新する第2のステップと、
前記更新する第2のステップで更新された各局所モデルの学習パラメータが所定の条件を充足しているか否かを判定するステップと、
前記判定するステップで各局所モデルの学習パラメータが前記所定の条件を充足していると判定されたことに応答して、局所モデルを追加又は削除するステップとを含む、請求項3に記載の物理系の制御方法。The updating step is
For each of the existing local models, based on the state data, based on tracking errors between the target trajectory of the physical system and the actual trajectory, and an approximation error between the state data and the function approximation A second step of updating the learning parameter to minimize a predetermined error indicator;
Determining whether a learning parameter of each local model updated in the second step of updating satisfies a predetermined condition;
The method according to claim 3, further comprising the steps of: adding or deleting a local model in response to determining that the learning parameter of each local model satisfies the predetermined condition in the determining step. System control method.
前記局所モデルごとに、
前記状態データおよび前記トラッキング誤差に基づいて前記重みwkを計算するステップと、
前記重みwkを用い、以下の式
所定の式により定められる、学習データを表わす関数値yと関数近似^yとの間で定められる誤差指標を最小化することにより、距離メトリックの各々を最適化するステップとを含む、請求項4に記載の物理系の制御方法。The second step of updating is
For each of the local models,
Calculating the weights w k based on said status data and said tracking error,
Using the weight w k , the following equation
Optimizing each of the distance metrics by minimizing an error indicator defined between the function value y representing the training data and the function approximation y y defined by the predetermined equation. The control method of the physical system as described in.
前記追加又は削除するステップは、すべての局所モデルに対して算出された重みwkが所定のしきい値未満と判定されたことに応答して、新たな局所モデルを追加するステップを含む、請求項5に記載の物理系の制御方法。The determining step includes the step of determining whether the weights w k (k = 1 to the number of local models) calculated for all the local models are less than a predetermined threshold value.
Wherein the step of adding or deleting includes the step of all the weights w k calculated for the local model in response to the determination that below a predetermined threshold, adding a new local model, wherein Item 5. A control method of a physical system according to item 5.
前記関数近似の初期構造を規定するための初期化手段と、
前記物理系の実際の状態を表わす状態データを受信するための受信手段と、
前記状態データに基づいて、前記物理系の目標軌跡と実際の軌跡との間のトラッキング誤差、および前記状態データと前記関数近似との間の近似誤差に基づいて、各局所モデルごとに独立に所定の誤差指標を最小化するように各局所モデルの学習パラメータを更新することで前記関数近似を更新するための更新手段と、
更新された前記関数近似を用い、前記制御系の制御則にしたがって制御変数の計算を行なうための計算手段と、
計算された前記制御変数を前記物理系に出力するための出力手段と、
前記受信手段、更新手段、計算手段および前記出力手段が繰返し動作するよう制御するための制御手段とを含む、物理系の制御装置。A control system for a physical system, which controls a physical system by approximating a non-linear function describing the dynamics of the physical system by a function approximation obtained by weighting and adding a linear local model. The structure of the local model making up the approximation and the respective weights are determined by predetermined learning parameters,
Initialization means for defining an initial structure of the function approximation;
Receiving means for receiving state data representing an actual state of the physical system;
Based on the state data, it is determined independently for each local model based on the tracking error between the target trajectory of the physical system and the actual trajectory, and the approximation error between the state data and the function approximation. Updating means for updating the function approximation by updating learning parameters of each local model so as to minimize an error index of
Calculation means for calculating control variables according to the control law of the control system using the updated function approximation;
Output means for outputting the calculated control variable to the physical system;
A control system for a physical system, comprising: the receiving means, the updating means, the calculating means, and a control means for controlling the output means to operate repeatedly.
wkは所定のカーネル関数により表わされる重み、
で表わされる、請求項12に記載の物理系の制御装置。The function approximation ^ y is
w k is a weight represented by a predetermined kernel function,
The control device of a physical system according to claim 12, represented by
既存の局所モデルの各々について、前記状態データに基づいて、前記物理系の目標軌跡と実際の軌跡との間のトラッキング誤差、および前記状態データと前記関数近似との間の近似誤差に基づいて、所定の誤差指標を最小化するように学習パラメータを更新するための第2の更新手段と、
前記第2の更新手段により更新された各局所モデルの学習パラメータが所定の条件を充足しているか否かを判定するための判定手段と、
前記判定手段が各局所モデルの学習パラメータが前記所定の条件を充足していると判定したことに応答して、局所モデルを追加又は削除するための手段とを含む、請求項14に記載の物理系の制御装置。The updating means is
For each of the existing local models, based on the state data, based on tracking errors between the target trajectory of the physical system and the actual trajectory, and an approximation error between the state data and the function approximation Second updating means for updating the learning parameters to minimize a predetermined error indicator;
Determining means for determining whether the learning parameter of each local model updated by the second updating means satisfies a predetermined condition;
And means for adding or deleting a local model in response to the determination means determining that the learning parameter of each local model satisfies the predetermined condition. Control system.
前記局所モデルごとに、
前記状態データおよび前記トラッキング誤差に基づいて前記重みwkを計算するための手段と、
前記重みwkを用い、以下の式
所定の式により定められる、学習データを表わす関数値yと関数近似^yとの間で定められる誤差指標を最小化することにより、距離メトリックの各々を最適化するための最適化手段とを含む、請求項15に記載の物理系の制御装置。The second updating means is
For each of the local models,
Means for calculating the weights w k based on said status data and said tracking error,
Using the weight w k , the following equation
And optimization means for optimizing each of the distance metrics by minimizing an error indicator defined between a function value y representing the training data and a function approximation y determined by a predetermined equation The control device of a physical system according to claim 15.
前記追加又は削除するための手段は、すべての局所モデルに対して算出された重みwkが所定のしきい値未満と判定されたことに応答して、新たな局所モデルを追加するための追加手段を含む、請求項16に記載の物理系の制御装置。The determining means includes means for determining whether the weights w k (k = 1 to the number of local models) calculated for all the local models are less than a predetermined threshold value,
Said means for adding or deleting, all weights w k calculated for the local model in response to the determination that below a predetermined threshold, additional to add a new local model The control device of the physical system according to claim 16 including means.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002282987A JP3868358B2 (en) | 2002-09-27 | 2002-09-27 | Method and apparatus for controlling physical system and computer program for controlling physical system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002282987A JP3868358B2 (en) | 2002-09-27 | 2002-09-27 | Method and apparatus for controlling physical system and computer program for controlling physical system |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2004118658A JP2004118658A (en) | 2004-04-15 |
| JP2004118658A5 true JP2004118658A5 (en) | 2005-05-12 |
| JP3868358B2 JP3868358B2 (en) | 2007-01-17 |
Family
ID=32276990
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002282987A Expired - Fee Related JP3868358B2 (en) | 2002-09-27 | 2002-09-27 | Method and apparatus for controlling physical system and computer program for controlling physical system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3868358B2 (en) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4193760B2 (en) * | 2004-06-29 | 2008-12-10 | 日本電気株式会社 | Image pattern correction method, simulated image generation method using the same, and pattern appearance inspection method |
| JP5812389B2 (en) * | 2011-04-19 | 2015-11-11 | いすゞ自動車株式会社 | Design method, control apparatus and program for nonlinear adaptive model-based control |
| JP5988419B2 (en) | 2012-01-11 | 2016-09-07 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Prediction method, prediction system, and program |
| JP6507512B2 (en) * | 2014-07-25 | 2019-05-08 | 富士通株式会社 | Estimation program, estimation method and estimation apparatus |
| WO2019155511A1 (en) * | 2018-02-06 | 2019-08-15 | Nec Corporation | Inverse model predictive control system, inverse model predictive control method, and inverse model predictive control program |
| JP7384059B2 (en) | 2020-02-06 | 2023-11-21 | 富士通株式会社 | Detection program, detection method and detection device |
| CN114488813A (en) * | 2022-01-26 | 2022-05-13 | 青岛科技大学 | A Setpoint Update Method for Model-Free Adaptive Control |
| CN114819136B (en) * | 2022-03-21 | 2025-06-13 | 韶关学院 | Parallel deep convolutional neural network optimization method based on Im2col |
| CN115309058B (en) * | 2022-06-10 | 2023-06-30 | 哈尔滨理工大学 | A finite-time composite learning control method for dynamically positioned ships |
| CN115616907B (en) * | 2022-09-22 | 2023-08-04 | 上海海事大学 | Unmanned ship course intelligent planning method and controller |
| CN118938686B (en) * | 2024-08-28 | 2025-11-25 | 施耐德电气(中国)有限公司 | A method for intelligent optimization of control parameters of a servo motor system |
-
2002
- 2002-09-27 JP JP2002282987A patent/JP3868358B2/en not_active Expired - Fee Related
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11914350B2 (en) | Manufacturing process control using constrained reinforcement machine learning | |
| US10048658B2 (en) | Information processing device, predictive control method, and recording medium | |
| US20200333752A1 (en) | Configuring a system which interacts with an environment | |
| CN113874865A (en) | Method and device for determining model parameters of a control strategy of a technical system by means of a Bayesian optimization method | |
| JP2004118658A5 (en) | ||
| JP7699660B2 (en) | Method and system for modeling and controlling a partially scalable system - Patents.com | |
| WO1996012990A1 (en) | Model predictive control apparatus and method | |
| WO2019008075A1 (en) | A method and apparatus for performing control of a movement of a robot arm | |
| Nguyen-Tuong et al. | Learning robot dynamics for computed torque control using local Gaussian processes regression | |
| Sacks et al. | Learning sampling distributions for model predictive control | |
| US20210379761A1 (en) | Controller and method for selecting evaluation points for a bayesian optimization method | |
| JP3868358B2 (en) | Method and apparatus for controlling physical system and computer program for controlling physical system | |
| CN118891136A (en) | System and method for flexible robotic manipulation via fast online load estimation | |
| CN113467487A (en) | Path planning model training method, path planning device and electronic equipment | |
| CN112292239B (en) | Method and device for computer-aided determination of control parameters for a suitable operating technical system | |
| US12246449B2 (en) | Device and method for controlling a robotic device | |
| CN118752492A (en) | Motion control method for multi-task and multi-robot based on deep reinforcement learning | |
| KR20190099111A (en) | A method for devising an optimum control policy, training system, control system, computer program and machine-readable storage medium | |
| US6738688B2 (en) | Method of predicting carrying time in automatic warehouse system | |
| CN114770492A (en) | Apparatus and method for training a Gaussian process state space model | |
| WO2024180656A1 (en) | Learning device, control device, control system, learning method, and storage medium | |
| JP2004265069A (en) | Model parameter identification method of virtual passive joint model and its control method | |
| Sendrescu et al. | Control of a rotary flexible joint experiment based on reinforcement learning | |
| Herrero et al. | Multiobjective tuning of robust PID controllers using evolutionary algorithms | |
| Chinnam et al. | Neural network-based quality controllers for manufacturing systems |