WO2025164369A1

WO2025164369A1 - 画像認識装置及び画像認識方法

Info

Publication number: WO2025164369A1
Application number: PCT/JP2025/001345
Authority: WO
Inventors: 博昭五十嵐; 健一米司; 育郎佐藤; 康太石川; 哲平鈴木; 雄介関川; 満安倍
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2024-02-01
Filing date: 2025-01-17
Publication date: 2025-08-07
Anticipated expiration: 2026-08-01

Abstract

周辺画像に対して複数の画像認識タスクを実行するマルチタスク処理が可能であって、且つ、画像認識タスクの処理内容の調整が可能な検出器（１０３）と、検出器（１０３）での複数の画像認識タスクの処理内容を調整するコントローラ部（１０４）とを備え、コントローラ部（１０４）は、周辺画像を入力として、その周辺画像の内容の傾向に応じて、検出器（１０３）での複数の画像認識タスクの処理内容を動的に変更する。

Description

画像認識装置及び画像認識方法

関連出願の相互参照

　この出願は、２０２４年２月１日に日本に出願された特許出願第２０２４－１４４０９号を基礎としており、基礎の出願の内容を、全体的に、参照により援用している。

　本開示は、画像認識装置及び画像認識方法に関するものである。

　特許文献１には、物体の検出精度又は検出速度が異なる３つの検出器によって、入力される画像データから物体を検出する技術が開示されている。また、コントローラが、画像データのフレーム毎に、この３つの検出器のうちの１つの検出器を選択し、物体検出を行うことも開示されている。特許文献１に開示の技術では、コントローラは、処理すべき画像データ量を示す情報であるデータ負荷に応じて、３つの検出器のうちの１つの検出器を選択する。コントローラは、データ負荷が大きい場合に高速の検出器を頻繁に選択し、データ負荷が小さい場合に高精度の検出器を頻繁に選択する。

国際公開第２０２１／０１４６４３号

　しかしながら、特許文献１に開示の技術では、複数の画像認識のタスク（以下、画像認識タスク）を検出器が担うマルチタスク化を行う場合に、問題が生じると考えられる。詳しくは、以下の通りである。

　画像認識タスクは、画像の示すシーンによって、処理が容易な場合も困難な場合もある。また、複数の画像認識タスクは、画像の示すシーンによって、それぞれの画像認識タスクの必要性が異なる場合がある。よって、マルチタスク化を行う場合、画像の示すシーンに応じて、どの画像認識タスクの処理精度又は処理速度を、どの程度優先すべきかを変えられることが好ましい。これに対して、特許文献１に開示の技術では、物体の検出精度又は検出速度が異なる検出器を、画像データ量を示す情報であるデータ負荷に応じて選択することしかできない。よって、マルチタスク化を行う場合に、シーンに応じて、より好ましい処理精度及び処理速度のバランスで複数の画像認識タスクを行わせることが困難である。

　この開示の１つの目的は、シーンに応じて、より好ましい精度と速度とのバランスで画像認識タスクを行わせることを、より容易に可能とする画像認識装置及び画像認識方法を提供することにある。

　請求の範囲に記載した括弧内の符号は、１つの態様として後述する実施形態に記載の具体的手段との対応関係を示すものであって、本開示の技術的範囲を限定するものではない。

　上記目的を達成するために、本開示の画像認識装置は、画像に対して複数の画像認識タスクを実行するマルチタスク処理が可能であって、且つ、画像認識タスクの処理内容の調整が可能な画像処理部と、画像処理部での複数の画像認識タスクの処理内容を調整するコントローラ部とを備え、コントローラ部は、画像を入力として、その画像の内容の傾向に応じて、画像処理部での複数の画像認識タスクの処理内容を動的に変更する。

　上記目的を達成するために、本開示の画像認識方法は、少なくとも１つのプロセッサにより実行される、画像に対して複数の画像認識タスクを実行するマルチタスク処理が可能であって、且つ、画像認識タスクの処理内容の調整が可能な画像処理工程と、画像処理工程での複数の画像認識タスクの処理内容を調整するコントローラ工程とを含み、コントローラ工程では、画像を入力として、その画像の内容の傾向に応じて、画像処理工程での複数の画像認識タスクの処理内容を動的に変更する。

　以上の構成によれば、画像に対して複数の画像認識タスクを実行するマルチタスク処理の内容を、その画像の内容の傾向に応じて動的に変更できる。よって、画像の内容が示すシーンに応じて、複数の画像認識タスクの処理速度及び処理精度のバランスを動的に変更することが可能になる。その結果、シーンに応じて、より好ましい精度と速度とのバランスで画像認識タスクを行わせることが、より容易に可能になる。

画像認識システムの概略的な構成の一例を示す図である。実施形態１における画像認識装置の概略的な構成の一例を示す図である。コントローラ部の学習方法の一例について説明するための図である。検出器のＮＷ構造を動的に変更できない場合の例について説明するための図である。検出器のＮＷ構造を動的に変更できる場合の例について説明するための図である。実施形態２における画像認識装置の概略的な構成の一例を示す図である。実施形態３における画像認識装置の概略的な構成の一例を示す図である。

　図面を参照しながら、開示のための複数の実施形態を説明する。なお、説明の便宜上、複数の実施形態の間において、それまでの説明に用いた図に示した部分と同一の機能を有する部分については、同一の符号を付し、その説明を省略する場合がある。同一の符号を付した部分については、他の実施形態における説明を参照することができる。

　（実施形態１）
　＜画像認識システム１の概略構成＞
　以下、本開示の実施形態１について、図面を用いて説明する。図１に示す画像認識システム１は、車両で用いることが可能なものである。画像認識システム１は、図１に示すように、画像認識装置１０、ロケータ１１、地図データベース（以下、地図ＤＢ）１２、車両状態センサ１３、周辺監視センサ１４、車両制御ＥＣＵ１５、運転支援ＥＣＵ１６、室内カメラ１７、提示装置１８、及びＨＣＵ（Human Machine Interface Control Unit）１９を含んでいる。例えば、画像認識装置１０、ロケータ１１、地図ＤＢ１２、車両状態センサ１３、周辺監視センサ１４、車両制御ＥＣＵ１５、運転支援ＥＣＵ１６、及びＨＣＵ２０は、車内ＬＡＮ（図１のＬＡＮ参照）と接続される構成とすればよい。画像認識システム１を用いる車両は、必ずしも自動車に限るものではないが、以下では自動車に用いる場合を例に挙げて説明を行う。

　画像認識システム１を用いる車両は、自動運転が可能な車両（以下、自動運転車両）であってもよい。自動運転車両の自動運転の段階（以下、自動化レベル）としては、例えばＳＡＥが定義しているように、複数のレベルが存在し得る。自動化レベルは、例えば以下のようにＬＶ０～５に区分される。ＬＶ０は、システムが介入せずに運転者が全ての運転タスクを実施するレベルである。運転タスクは動的運転タスクと言い換えてもよい。運転タスクは、例えば操舵、加減速、及び周辺監視とする。ＬＶ０は、いわゆる手動運転に相当する。ＬＶ１は、システムが操舵と加減速とのいずれかを支援するレベルである。ＬＶ１は、いわゆる運転支援に相当する。ＬＶ２は、システムが操舵と加減速とのいずれをも支援するレベルである。ＬＶ２は、いわゆる部分運転自動化に相当する。なお、ＬＶ１～２も自動運転の一部であるものとする。ＬＶ３の自動運転は、特定の条件下ではシステムが全ての運転タスクを実施可能であり、緊急時に運転者が運転操作を行うレベルである。ＬＶ４の自動運転は、対応不可能な道路，極限環境等の特定状況下を除き、システムが全ての運転タスクを実施可能なレベルである。ＬＶ４は、いわゆる高度運転自動化に相当する。ＬＶ５の自動運転は、あらゆる環境下でシステムが全ての運転タスクを実施可能なレベルである。ＬＶ５は、いわゆる完全運転自動化に相当する。以下では、画像認識システム１を用いる車両が、少なくとも自動化レベルがＬＶ１以上である場合を例に挙げて説明を行う。

　ロケータ１１は、ＧＮＳＳ（Global Navigation Satellite System）受信機及び慣性センサを備えている。ＧＮＳＳ受信機は、複数の測位衛星からの測位信号を受信する。慣性センサは、例えばジャイロセンサ及び加速度センサを備える。ロケータ１１は、ＧＮＳＳ受信機で受信する測位信号と、慣性センサの計測結果とを組み合わせることにより、自車の車両位置（以下、自車位置）を逐次測位する。自車位置は、例えば緯度経度の座標で表されるものとすればよい。なお、自車位置の測位には、自車に搭載された車速センサから逐次出力される信号から求めた走行距離も用いる構成としてもよい。

　地図ＤＢ１２は、不揮発性メモリであって、ナビゲーション装置での経路案内に用いる地図データを格納している。経路案内に用いる地図データは、リンクデータ、ノードデータ等である。リンクデータは、リンクを特定するリンクＩＤ、リンクの長さを示すリンク長、リンク方位、リンク旅行時間、リンクの形状情報、リンクの始端と終端とのノード座標（緯度／経度）、及び道路属性等の各データから構成される。道路属性としては、道路名称、道路種別、道路幅員、及び速度規制値等がある。ノードデータは、地図上のノード毎に固有の番号を付したノードＩＤ、ノード座標、ノード名称、ノード種別、ノードに接続するリンクのリンクＩＤが記述される接続リンクＩＤ、交差点種別等の各データから構成される。地図ＤＢ１２は、高精度地図データを格納してもよい。高精度地図データは、経路案内に用いられる地図データよりも高精度な地図データである。高精度地図データには、例えば道路の三次元形状情報，車線数情報，各車線に許容された進行方向を示す情報等の運転支援に利用可能な情報が含まれている。

　車両状態センサ１３は、自車の各種状態を検出するためのセンサ群である。車両状態センサ１３としては、車速センサ等がある。車速センサは、自車の速度を検出する。車両状態センサ１３は、検出したセンシング情報を車内ＬＡＮへ出力する。なお、車両状態センサ１３で検出したセンシング情報は、自車に搭載されるＥＣＵを介して車内ＬＡＮへ出力される構成であってもよい。

　周辺監視センサ１４は、自車の周辺環境を監視する。一例として、周辺監視センサ１４は、歩行者，他車等の移動物体、及び路上の落下物等の静止物体といった自車周辺の障害物を検出する。他にも、自車周辺の走行区画線等の路面標示を検出する。周辺監視センサ１４は、周辺監視カメラ１４１を含む。周辺監視カメラ１４１は、逐次撮像する撮像画像を、センシング情報として逐次出力する。周辺監視カメラ１４１から逐次出力される撮像画像は、詳しくは撮像画像のデータとしての画像データである。以下では、周辺監視カメラ１４１から逐次出力される撮像画像を、周辺画像データと呼ぶ。周辺監視カメラ１４１は、撮像範囲が異なる複数のカメラであってもよい。周辺監視センサ１４は、周辺監視カメラ１４１の他に、探査波センサを含んでもよい。探査波センサとしては、ミリ波レーダ、ソナー、ＬｉＤＡＲ（Light Detection and Ranging/Laser Imaging Detection and Ranging）等が挙げられる。探査波センサは、障害物によって反射された反射波を受信した場合に得られる受信信号に基づく走査結果を、センシング情報として逐次出力する。

　車両制御ＥＣＵ１５は、自車の走行制御を行う電子制御装置である。走行制御としては、加減速制御及び／又は操舵制御が挙げられる。車両制御ＥＣＵ１５としては、操舵制御を行う操舵ＥＣＵ、加減速制御を行うパワーユニット制御ＥＣＵ及びブレーキＥＣＵ等がある。車両制御ＥＣＵ１５は、自車に搭載された各走行制御デバイスへ制御信号を出力することで走行制御を行う。走行制御デバイスとしては、電子制御スロットル，ブレーキアクチュエータ，ＥＰＳ（Electric Power Steering）モータ等が挙げられる。

　運転支援ＥＣＵ１６は、自車の運転支援を行う電子制御装置である。運転支援ＥＣＵ１６は、上述した多様な車載デバイスから入力される信号に基づいて、運転支援に関する処理を実行する。運転支援ＥＣＵ１６は、車両制御ＥＣＵ１５との連携により、自車の加減速制御及び操舵制御等を実行する。運転支援の例としては、ＡＣＣ（Adaptive Cruise Control）制御、ＰＣＳ（Pre-Collision Safety）制御、ＡＥＢ（Automatic Emergency Braking）制御等が挙げられる。

　室内カメラ１７は、自車の車室内の所定範囲を撮像する。室内カメラ１７は、少なくとも自車の運転席を含む範囲を撮像するものとする。室内カメラ１７は、例えば近赤外光源及び近赤外カメラと、これらを制御する制御ユニット等とによって構成される。室内カメラ１７は、近赤外光源によって近赤外光を照射された運転者を、近赤外カメラによって撮影する。近赤外カメラによる撮像画像は、制御ユニットによって画像解析される。制御ユニットは、撮像画像を画像解析して運転者の顔向き，視線方向等の状態を検出する。室内カメラ１７は、検出した運転者の状態を、ＨＣＵ１９へ逐次出力する。

　提示装置１８は、自車に設けられて、自車の室内へ向けて情報提示を行う。つまり、提示装置１８は、自車の運転者に向けて情報提示を行う。提示装置１８は、ＨＣＵ１９の指示に従って情報提示を行う。提示装置１８には、表示装置１８１を含む。表示装置１８１は、情報を表示することで情報提示を行う。表示装置１８１としては、例えばメータＭＩＤ（Multi Information Display），ＣＩＤ（Center Information Display），ＨＵＤ（Head-Up Display）等を用いることができる。メータＭＩＤは、自車の室内のうちの運転席の正面に設けられる表示装置である。一例として、メータＭＩＤは、メータパネルに設けられる構成とすればよい。ＣＩＤは、自車のインスツルメントパネルの中央に配置される表示装置である。ＨＵＤは、車室内のうちの例えばインスツルメントパネルに設けられる。ＨＵＤは、プロジェクタによって形成される表示像を、投影部材としてのフロントウインドシールドに既定された投影領域に投影する。ＨＵＤは、フロントウインドシールドの代わりに、運転席の正面に設けられるコンバイナに表示像を投影する構成としてもよい。なお、提示装置１８は、音を出力することで情報提示を行う音声出力装置を含んでもよい。

　ＨＣＵ１９は、乗員と自車のシステムとのやり取りに関する各種の処理を実行する電子制御装置である。ＨＣＵ１９は、提示装置１８から情報提示を行わせる。ＨＣＵ１９は、室内カメラ１７で検出した運転者の状態を取得する。なお、ＨＣＵ２０は、室内カメラ１７で撮像した撮像画像から、運転者の状態を特定してもよい。つまり、室内カメラ１７の制御ユニットの機能の一部を、ＨＣＵ１９が担ってもよい。

　画像認識装置１０は、例えばプロセッサ、揮発性メモリ、不揮発性メモリ、Ｉ／Ｏ、これらを接続するバスを備えるコンピュータを主体として構成される。画像認識装置１０は、不揮発性メモリに記憶された制御プログラムを実行することにより、画像認識に関する処理を実行する。画像認識装置１０は、周辺監視カメラ１４１で撮像した画像に対して、画像認のタスク（以下、画像認識タスク）を実行し、画像認識タスクに応じた対象を認識する。例えば、画像認識タスクが、意味的分割（Semantic Segmentation）の場合には、クラス識別を行って、クラス別に画像上の領域分割を行う。この場合のクラスは、意味的な単位であって、例えば「道路」，「人」，「自転車」といった単位である。画像認識タスクが、信号機検出の場合には、信号機の灯色，点滅状態等を認識する。画像認識タスクが、分岐路検出の場合には、分岐路を認識する。画像認識タスクは、上述した以外を画像から認識するものであってもよい。画像認識装置１０は、複数の画像認識タスクを行う。つまり、画像認識装置１０は、マルチタスク処理を行う。画像認識装置１０の構成については、以下で詳述する。

　＜画像認識装置１０の概略構成＞
　続いて、図２を用いて画像認識装置１０の概略構成についての説明を行う。画像認識装置１０は、図２に示すように、画像取得部１０１、車両関連取得部１０２、検出器１０３、及びコントローラ部１０４を機能ブロックとして備える。また、コンピュータによって画像認識装置１０の各機能ブロックの処理が実行されることが、画像認識方法が実行されることに相当する。なお、画像認識装置１０が実行する機能の一部又は全部を、１つ或いは複数のＩＣ等によりハードウェア的に構成してもよい。また、画像認識装置１０が備える機能ブロックの一部又は全部は、プロセッサによるソフトウェアの実行とハードウェア部材との組み合わせによって実現されてもよい。

　画像取得部１０１は、周辺監視カメラ１４１から逐次出力されてくる周辺画像データを取得する。本実施形態の例では、周辺監視カメラ１４１で撮像した周辺画像のデータを画像認識に用いる場合を例に挙げて説明するが、必ずしもこれに限らない。例えば、ＬｉＤＡＲ等の画像認識に用いることが可能な他の周辺監視センサ１４で検出したセンシング結果を画像認識に用いる構成としてもよい。この場合、このセンシング結果も周辺画像データに含まれるものとすればよい。車両関連取得部１０２は、周辺画像データ以外の、車両に関連する情報（以下、車両関連情報）を取得する。車両関連情報としては、自車の車速の情報，地図情報，運転者状態の情報，センサ特性の情報等が挙げられる。自車の車速の情報を、以下では車速情報と呼ぶ。

　車両関連取得部１０２は、車速情報を、車両状態センサ１３のうちの車速センサから取得すればよい。車両関連取得部１０２は、地図情報を、地図ＤＢ１２から取得すればよい。車両関連取得部１０２は、ロケータ１１で測位した自車位置の周辺に絞って、地図情報を取得してもよい。車両関連取得部１０２は、ＨＣＵ１９から運転者の状態を取得する。運転者の状態としては、例えば室内カメラ１７を用いて検出した視線方向を取得すればよい。車両関連取得部１０２は、センサ特性を、周辺監視センサ１４から取得すればよい。周辺監視センサ１４の不揮発性メモリには、周辺監視センサ１４に含まれるセンサごとのセンサ特性が予め記憶されているものとすればよい。例えば、センサ特性は、周辺監視センサ１４に含まれるセンサごとの不得意物体及び不得意状況を示すデータとすればよい。不得意物体とは、センサの検出原理の特性に由来して検出困難な物体とする。不得意状況は、物体の検出性能が劣化しうる状況を示す。なお、不得意物体には、他の種別の物体と誤検知しやすい物体、検出結果が安定しない物体を含んでもよい。

　検出器１０３は、画像取得部１０１で取得した周辺画像に対して複数の画像認識タスクを実行する。つまり、検出器１０３は、画像取得部１０１で取得した周辺画像に対するマルチタスク処理が可能なものである。この検出器１０３が画像処理部に相当する。また、この検出器１０３での処理が画像処理工程に相当する。検出器１０３は、周辺画像に対して、複数の画像認識タスクを実行することで、周辺画像から画像認識タスクごとの認識対象を認識する。この認識は、検出と言い換えてもよい。

　検出器１０３は、複数の画像認識タスクの実行を、機械学習モデルを用いて行えばよい。この機械学習モデルは、周辺画像を入力として、複数の画像認識タスクのそれぞれの認識対象を出力できるように機械学習を行って生成したモデルである。検出器１０３は、複数の画像認識タスクの実行を、機械学習モデルのうちのニューラルネットワーク（以下、ＮＮ）を用いて行えばよい。なお、検出器１０３は、ＮＮのようなネットワーク構造以外の機械学習モデルを用いて、複数の画像認識タスクの実行を行ってもよい。例えば、ツリー構造の機械学習モデルであるランダムフォレスト等を用いてもよい。以下では、検出器１０３としてＮＮを用いる場合を例に挙げて説明を続ける。検出器１０３は、複数の画像認識タスクの処理内容を動的に変更することが可能なものとする。本実施形態の例では、検出器１０３は、ＮＮのネットワーク構造及びパラメータを動的に変更することが可能なものとする。パラメータとは、例えばＮＮにおける各層の重み及びバイアスの少なくともいずれかである。本実施形態の例では、複数の画像認識タスクの処理内容が、ＮＮのネットワーク構造及び重みに対応する。

　コントローラ部１０４は、検出器１０３での複数の画像認識タスクの処理内容を調整する。コントローラ部１０４は、周辺画像を入力として、その周辺画像の内容の傾向に応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更する。コントローラ部１０４に入力される周辺画像は、画像取得部１０１で取得する周辺画像とすればよい。コントローラ部１０４での処理がコントローラ工程に相当する。

　以上の構成によれば、周辺画像に対して複数の画像認識タスクを実行するマルチタスク処理の内容を、その画像の内容の傾向に応じて動的に変更できる。周辺画像の内容の傾向は、周辺画像の内容が示すシーンに応じて変化する相関性が強い。よって、画像の内容が示すシーンに応じて、複数の画像認識タスクの処理速度及び処理精度のバランスを動的に変更することが可能になる。その結果、シーンに応じて、より好ましい精度と速度とのバランスで画像認識タスクを行わせることが、より容易に可能になる。コントローラ部１０４は、ＮＮのネットワーク構造及びパラメータのうちの少なくともいずれかを変更することで、検出器１０３での複数の画像認識タスクの処理内容を動的に変更すればよい。

　また、以上の構成によれば、周辺画像に対して画像認識タスクの処理内容が自動で切り替わるため、検出器１０３を設計する際の処理時間のマージンを省略することができる。よって、処理精度を固定とした場合、より高速な認識処理が達成される。また、副次的な効果として消費電力が低下する。他にも、周辺画像に対して画像認識タスクの処理内容が自動で切り替わるため、重要でない処理を低減し、重要な処理により時間を費やすことができる。よって、処理時間を固定とした場合、より高精度な認識処理が達成される。

　ここで、上述した効果について、図３及び図４を用いて説明する。図３は、マルチタスク処理の内容を動的に変更できない場合の例を説明するための図である。図４は、マルチタスク処理の内容を動的に変更できる場合の例を説明するための図である。図３及び図４では、マルチタスク処理での複数の画像認識タスクとして、意味的分割、信号機検出、及び分岐路検出を行う場合を例に挙げて説明する。図３及び図４のＳＳが、複数の画像認識タスクのうちの意味的分割を示す。図３及び図４のＴＬが、複数の画像認識タスクのうちの信号機検出を示す。図３及び図４のＢｒが、複数の画像認識タスクのうちの分岐路検出を示す。図３及び図４のＰＣは、複数の画像認識タスクの性能のバランスと演算量とを模式的に示すものである。ここで言うところの性能とは、処理精度と言い換えることができる。ＰＣのパターン分けされた各領域の比率が、複数の画像認識タスクの性能のバランスを示す。また、ＰＣの大きさが、複数の画像認識タスクの全体での演算量を示す。この演算量は画像認識タスクの処理速度に影響する。図３及び図４のＮＳが、ＮＮのネットワーク構造を示す。図３及び図４のＰＢが、ＮＮの処理ブロックを示す。図４のＤｅ，ＩＰ，ＨＲがそれぞれ異なるシーンを示す。Ｄｅがデフォルトのシーンとする。ＩＰが交差点走行のシーンとする。ＨＲが高速道路走行のシーンとする。図４の例では、交差点走行及び高速道路走行のいずれでもない場合をデフォルトのシーンとすればよい。図４では、未使用の処理ブロックを破線で示し、使用する処理ブロックを実線で示している。

　図３に示すように、マルチタスク処理の内容を動的に変更できない場合、シーンにかかわらず、複数の画像認識タスクの処理速度及び処理精度は変更できない。一方、図４に示すように、マルチタスク処理の内容を動的に変更できる場合、シーンに応じて、複数の画像認識タスクの処理速度及び処理精度を変更できる。例えば、交差点走行のシーンの場合、交差点走行に必要性がより高いと考えられる意味分割及び信号機検出の処理精度を分岐路検出に優先して高めることが可能になる。他にも、高速道路走行のシーンの場合、図４に示すように、高速道路走行に必要性がより低いと考えられる信号機検出の処理精度よりも意味分割及び分岐路検出の処理精度を優先して高めることが可能になる。また、外乱の少ない高速道路走行のシーンの場合、他のシーンよりも全体の演算量を抑えるように、複数の画像認識タスクの処理速度を変更することも可能になる。

　コントローラ部１０４は、機械学習モデルによって、シーンに応じた複数の画像認識タスクの処理速度及び処理精度の変更を行えばよい。この機械学習モデルは、周辺画像の内容の傾向に合った複数の画像認識タスクの処理速度及び処理精度のバランスとなるＮＮのネットワーク構造及びパラメータを、周辺画像の内容の傾向別に学習した機械学習モデルとすればよい。この学習は、各画像認識タスクの検出結果から計算する精度損失とネットワーク構成から計算する演算量とを最小化するように行えばよい。この機械学習モデルは、例えばＣＮＮ（convolutional neural network）のようなＨｙｐｅｒｎｅｔｗｏｒｋによって実現すればよい。

　ここで、図５を用いて、各画像認識タスクの検出結果から計算する精度損失とネットワーク構成から計算する演算量とを最小化する学習について説明する。図５は、コントローラ部１０４の学習の一例について説明するための図である。図５の演算量計算部１０５、演算量テーブル１０６、精度損失計算部１０７、及び正解ラベル１０８は、機能ブロックとして画像認識装置１０が備えるものとすればよい。

　演算量計算部１０５は、コントローラ部１０４が生成する検出器１０３のＮＮについて、演算量を計算する。演算量計算部１０５は、演算量テーブル１０６を参照して、演算量を計算する。演算量テーブル１０６は、ネットワーク構造のノード，エッジといった単位別の演算量を予め記憶したデータベースとすればよい。この演算量は、ＮＮの各層の演算量と言い換えることもできる。演算量には、ハードウェア間のデータ通信量を含めてもよい。演算量テーブル１０６は、例えば不揮発性メモリを用いて実現すればよい。演算量計算部１０５は、演算量テーブル１０６を参照し、演算量の計算の対象となるネットワーク構造を構成する単位ごとの演算量を足し合わせることで、ＮＮの演算量を計算すればよい。

　精度損失計算部１０７は、検出器１０３での検出結果から、検出器１０３のＮＮを用いた認識における精度損失を計算する。精度損失計算部１０７は、正解ラベル１０８を参照して、精度損失を計算する。正解ラベル１０８は、学習に用いる周辺画像別の正解の認識結果を予め記憶したデータベースとすればよい。精度損失計算部１０７は、正解ラベル１０８を参照し、検出器１０３での検出結果がどの程度正しかったかによって、精度損失を計算すればよい。

　図５で例を示す学習では、コントローラ部１０４が生成する検出器１０３のＮＮのネットワーク構造及びパラメータを変化させながら、ＮＮの演算量及び精度損失を計算していく。そして、学習に用いる周辺画像の内容の傾向別に、ＮＮの演算量及び精度損失が最小化するネットワーク構造及びパラメータを学習する。これにより、周辺画像の内容の傾向に応じた、画像認識タスクの処理速度及び処理精度とのバランスをとることのできるＮＮのネットワーク構造及びパラメータを、コントローラ部１０４が生成できるようにする。

　コントローラ部１０４は、周辺画像の内容の傾向に応じて、与えられる処理時間の制約に対して複数の画像認識タスクの各々の処理精度が最大化するように、検出器１０３での複数の画像認識タスクの処理内容を動的に変更してもよい。これは、周辺画像の内容の傾向に応じて、与えられる処理時間の制約に対して複数の画像認識タスクの各々の処理精度が最大化する画像認識タスクの処理内容を学習した学習結果を用いて実現すればよい。これによれば、シーンに応じて、与えられる処理時間の制約に対する複数の画像認識タスクの各々の処理精度が最大化するように画像認識タスクを行わせることが、より容易に可能になる。

　コントローラ部１０４は、周辺画像の内容の傾向に応じて、与えられる処理精度の制約に対して複数の画像認識タスクの各々の処理速度の合計が最小化するように、検出器１０３での複数の画像認識タスクの処理内容を動的に変更してもよい。これは、周辺画像の内容の傾向に応じて、与えられる処理精度の制約に対して複数の画像認識タスクの各々の処理速度の合計が最小化する画像認識タスクの処理内容を学習した学習結果を用いて実現すればよい。これによれば、シーンに応じて、与えられる処理速度の制約に対する複数の画像認識タスクの各々の処理速度の合計が最小化するように画像認識タスクを行わせることが、より容易に可能になる。

　コントローラ部１０４は、周辺画像の内容の傾向に応じて、与えられる処理精度の制約に対して複数の画像認識タスクの各々のハードウェアリソースの使用量の合計が最小化するように、検出器１０３での複数の画像認識タスクの処理内容を動的に変更してもよい。これは、周辺画像の内容の傾向に応じて、与えられる処理精度の制約に対して複数の画像認識タスクの各々のハードウェアリソースの使用量の合計が最小化する画像認識タスクの処理内容を学習した学習結果を用いて実現すればよい。これによれば、シーンに応じて、与えられる処理精度の制約に対する複数の画像認識タスクの各々のハードウェアリソースの使用量の合計が最小化するように画像認識タスクを行わせることが、より容易に可能になる。ハードウェアリソースは、例えばメモリとすればよい。ハードウェアリソースは、プロセッサ，ストレージ等を含んでもよい。

　コントローラ部１０４は、シーン分類部１０４１をサブ機能ブロックとして有することが好ましい。なお、シーン分類部１０４１は、コントローラ部１０４と別体に設けられる構成としても構わない。シーン分類部１０４１は、周辺画像を入力として、その周辺画像の内容が示すシーンを分類する。コントローラ部１０４は、周辺画像の内容の傾向として、シーン分類部１０４１で分類したシーンに応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更することが好ましい。これによれば、シーンに応じて、より好ましい精度と速度とのバランスで画像認識タスクを行わせることを、より精度良く実行可能になる。シーン分類部１０４１は、ルールベースであっても学習ベースであってもよい。学習ベースの場合は、機械学習モデルによって、周辺画像からシーンを分類する構成とすればよい。機械学習モデルとしては、例えば周辺画像からシーンを分類できるように学習したＮＮを用いればよい。分類されるシーンとしては、例えば高速道路、駐車場、交差点周辺等が挙げられる。

　コントローラ部１０４は、周辺画像以外の入力に応じた処理を行う構成としてもよい。周辺画像以外の入力の例として、車両関連取得部１０２で取得する車両関連情報、時系列情報等が挙げられる。時系列情報は、前フレームの周辺画像についての検出器１０３での検出結果とすればよい。コントローラ部１０４は、車両関連情報，時系列情報も利用して、検出器１０３での複数の画像認識タスクの処理内容を動的に変更してもよい。コントローラ部１０４は、車両関連情報，時系列情報にも応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更してもよい。この場合、コントローラ部１０４は、車両関連情報、時系列情報にも応じた複数の画像認識タスクの処理のバランスを学習した学習結果から、検出器１０３での複数の画像認識タスクの処理内容を動的に変更すればよい。

　コントローラ部１０４は、車両関連取得部１０２で取得する車速情報にも応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更すればよい。コントローラ部１０４は、例えば車速が速くなるのに応じて、車速がより遅い場合よりも、複数の画像認識タスクの処理速度がより大きくなるように変更すればよい。車速が速くなるほど短時間での周辺画像の変化が大きくなるため、より大きな処理速度が必要となる。以上の構成によれば、この要求に応えることが容易に可能となる。

　コントローラ部１０４は、車両関連取得部１０２で取得する地図情報も利用することが好ましい。例えば、コントローラ部１０４は、シーン分類部１０４１でのシーンの分類を、地図情報を用いて補強したり修正したりしてもよい。以上の構成によれば、シーンに応じて、より好ましい精度と速度とのバランスで画像認識タスクを行わせることを、さらに精度良く実行可能になる。

　コントローラ部１０４は、車両関連取得部１０２で取得する運転者の状態にも応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更すればよい。コントローラ部１０４は、例えば運転者の視線が向いていない方向にあたる画像認識タスクについて、処理精度がより高くなるように変更すればよい。例えば、視線が右方向の場合には、左方向，正面の物体認識についての画像認識タスクの処理精度をより高くするように変更すればよい。他にも、撮像方向別に検出器１０３で画像認識を行う場合には、運転者の視線が向いていない方向にあたる周辺画像について、処理精度がより高くなるように複数の画像認識タスクの処理内容を変更すればよい。以上の構成によれば、運転者が注視していない領域の画像認識の精度を優先的に高くし、自車のシステム側に運転支援をより任せやすくすることが可能となる。

　コントローラ部１０４は、車両関連取得部１０２で取得するセンサ特性にも応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更すればよい。例えばコントローラ部１０４は、周辺監視カメラ１４１以外の周辺監視センサ１４にとって不得意状況にあたるシーンでは、検出器１０３での複数の画像認識タスクの処理精度を上げるように変更すればよい。不得意状況にあたるシーンか否かは、シーン分類部１０４１で分類したシーンとセンサ特性とから、コントローラ部１０４が判断すればよい。以上の構成によれば、センサフュージョンにおいて、不得意状況にあたる周辺監視センサ１４による検出精度の劣化を補いやすくなる。

　コントローラ部１０４は、時系列情報に応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更すればよい。コントローラ部１０４は、前フレームの周辺画像についての検出器１０３での検出結果に応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更すればよい。コントローラ部１０４は、認識が難しいと推測される検出結果だったか認識が容易と推測される検出結果だったかで変更を行えばよい。認識が難しいか容易かは、歩行者，車といった認識対象の多さで区別すればよい。コントローラ部１０４は、認識が難しいと推測される検出結果だった場合には、認識が難しいと推測される場合に適した複数の画像認識タスクの処理内容に変更すればよい。コントローラ部１０４は、認識が難しさに応じた複数の画像認識タスクの処理内容は、機械学習によって学習しておけばよい。以上の構成によれば、画像認識の難しさに応じて適した画像認識タスクの処理を行わせることが可能になる。

　他にも、コントローラ部１０４は、シーンに応じて不要な画像認識タスクをオフにしてもよい。例えば、歩行者が存在しない筈の高速道路では、歩行者を検出する画像認識タスクをオフにしてもよい。

　コントローラ部１０４は、検出器１０３の制御以外の出力に関する処理を行ってもよい。以下では、この処理の例について説明する。コントローラ部１０４は、検出器１０３の処理負荷が規定値以上となった場合に、運転者に対する減速要請を行ったり、減速制御を行ったりしてもよい。これによれば、自車が減速することで、検出器１０３の処理負荷を下げることが可能になる。検出器１０３の処理負荷が規定値以上となる場合とは、コントローラ部１０４が制御する検出器１０３の機械学習モデルについて、学習時に与えた処理時間及び処理精度の制約を満たせなくなった場合にあたる。減速要請は、提示装置１８から行わせればよい。減速制御は、運転支援ＥＣＵ１６から行わせればよい。減速制御を行わせる場合、提示装置１８から減速の理由も提示させればよい。これによれば、減速制御に対しての自車の乗員の不安感を抑えることが可能になる。

　コントローラ部１０４は、コントローラ部１０４の処理負荷が規定値以上となった場合に、撮像周期を長くするよう周辺監視カメラ１４１に指示を行ってもよい。これによれば、コントローラ部１０４の処理負荷を下げることが可能になる。コントローラ部１０４は、シーン分類部１０４１で分類するシーンに応じて、周辺監視カメラ１４１の撮像周期を変更させてもよい。例えば、高速道路といった外乱が少ない簡単なシーンでは、撮像周期を長くするよう周辺監視カメラ１４１に指示を行ってもよい。一方、認識処理が難しいシーンでは、撮像周期を長くするよう周辺監視カメラ１４１に指示を行ってもよい。

　コントローラ部１０４は、コントローラ部１０４の処理負荷が規定値以上となった場合に、周辺画像の解像度を低くするよう周辺監視カメラ１４１に指示を行ってもよい。これによれば、コントローラ部１０４の処理負荷を下げることが可能になる。コントローラ部１０４は、シーン分類部１０４１で分類するシーンに応じて、周辺監視カメラ１４１の解像度を変更させてもよい。例えば、高速道路といった外乱が少ない簡単なシーンでは、解像度を低くするよう周辺監視カメラ１４１に指示を行ってもよい。一方、認識処理が難しいシーンでは、解像度を高くするよう周辺監視カメラ１４１に指示を行ってもよい。

　（実施形態２）
　前述の実施形態の構成に限らず、以下の実施形態２の構成としてもよい。以下では、実施形態２の構成の一例について図を用いて説明する。実施形態２の画像認識システム１は、画像認識装置１０の代わりに画像認識装置１０ａを含む点を除けは、実施形態１の画像認識システム１と同様である。

　＜画像認識装置１０ａの概略構成＞
　続いて、図６を用いて画像認識装置１０ａの概略構成についての説明を行う。画像認識装置１０ａは、図６に示すように、画像取得部１０１、車両関連取得部１０２、検出器１０３、及びコントローラ部１０４ａを機能ブロックとして備える。画像認識装置１０ａは、コントローラ部１０４の代わりにコントローラ部１０４ａを備える点を除けば、実施形態１の画像認識装置１０と同様である。また、コンピュータによって画像認識装置１０ａの各機能ブロックの処理が実行されることが、画像認識方法が実行されることに相当する。

　コントローラ部１０４ａは、シーン分類部１０４１及び不確実性予測部１０４２をサブ機能ブロックとして有する。コントローラ部１０４ａは、不確実性予測部１０４２を有する点を除けば、実施形態１のコントローラ部１０４と同様である。なお、不確実性予測部１０４２は、コントローラ部１０４ａと別体に設けられる構成としても構わない。不確実性予測部１０４２が、第１不確実性予測部に相当する。

　不確実性予測部１０４２は、データの不確実性（Aleatoric uncertainty）を予測する。不確実性予測部１０４２は、データの不確実性を、例えばベイズ推定等を用いて予測すればよい。不確実性予測部１０４２は、画像認識装置１０ａにシーン分類部１０４１を備える構成では、シーン分類部１０４１で分類するシーンの不確実性を予測する。この場合のデータの不確実性は、シーン分類部１０４１で分類するシーンの不確実性になる。シーンの不確実性は、シーンの分類の難しさと言い換えることができる。不確実性予測部１０４２は、画像認識装置１０ａにシーン分類部１０４１を備える構成を必須としない場合には、コントローラ部１０４ａで制御する検出器１０３が担う画像認識タスクの不確実性を周辺画像の内容の傾向から予測すればよい。

　コントローラ部１０４ａは、不確実性予測部１０４２で予測するデータの不確実性も用いて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更する。シーン分類部１０４１を必須の構成とする場合には、データの不確実性として、シーンの不確実性を用いる。コントローラ部１０４ａは、不確実性の大きさの度合いにも応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更すればよい。不確実性の大きさの度合いは、所定の閾値で区分される、不確実性が大きいレベルと不確実性が小さいレベルとの２段階であってもよい。コントローラ部１０４ａは、不確実性の高さの度合いごとに適した、複数の画像認識タスクの処理内容に変更すればよい。コントローラ部１０４ａは、不確実性の高さの度合いごとに適した、複数の画像認識タスクの処理内容を、機械学習によって学習しておけばよい。以上の構成によれば、データの不確実性に応じて適した画像認識タスクの処理を行わせることが可能になる。なお、実施形態２において、コントローラ部１０４ａがシーン分類部１０４１を有さない構成としてもよい。この場合、不確実性予測部１０４２は、画像取得部１０１からコントローラ部１０４ｂに入力されるデータの不確実性を予測すればよい。

　（実施形態３）
　前述の実施形態の構成に限らず、以下の実施形態３の構成としてもよい。以下では、実施形態３の構成の一例について図を用いて説明する。実施形態３の画像認識システム１は、画像認識装置１０の代わりに画像認識装置１０ｂを含む点を除けは、実施形態１の画像認識システム１と同様である。

　＜画像認識装置１０ｂの概略構成＞
　続いて、図７を用いて画像認識装置１０ｂの概略構成についての説明を行う。画像認識装置１０ｂは、図７に示すように、画像取得部１０１、車両関連取得部１０２、検出器１０３、及びコントローラ部１０４ｂを機能ブロックとして備える。画像認識装置１０ｂは、コントローラ部１０４の代わりにコントローラ部１０４ｂを備える点を除けば、実施形態１の画像認識装置１０と同様である。また、コンピュータによって画像認識装置１０ｂの各機能ブロックの処理が実行されることが、画像認識方法が実行されることに相当する。

　コントローラ部１０４ｂは、シーン分類部１０４１及び不確実性予測部１０４２ｂをサブ機能ブロックとして有する。コントローラ部１０４ｂは、不確実性予測部１０４２ｂを有する点を除けば、実施形態１のコントローラ部１０４と同様である。なお、不確実性予測部１０４２ｂは、コントローラ部１０４ｂと別体に設けられる構成としても構わない。不確実性予測部１０４２ｂが、第２不確実性予測部に相当する。実施形態３では、コントローラ部１０４ｂがシーン分類部１０４１を有することは、必須ではない。

　不確実性予測部１０４２ｂは、データの不確実性（Aleatoric uncertainty）及びモデルの不確実性（Epistemic uncertainty）を予測する。不確実性予測部１０４２ｂは、データの不確実性については、不確実性予測部１０４２と同様にして予測すればよい。不確実性予測部１０４２ｂは、コントローラ部１０４ｂがシーン分類部１０４１を有する場合には、実施形態２の不確実性予測部１０４２と同様に、シーンの不確実性を予測すればよい。不確実性予測部１０４２ｂは、コントローラ部１０４ｂがシーン分類部１０４１を有さない場合には、画像取得部１０１からコントローラ部１０４ｂに入力されるデータの不確実性を予測すればよい。不確実性予測部１０４２ｂは、モデルの不確実性については、例えば確率論的モデリング等を用いて予測すればよい。モデルの不確実性とは、コントローラ部１０４ｂが制御する検出器１０３の機械学習モデルの不確実性である。例えば、本実施形態の例では、画像取得部１０１から入力される画像に対する、機械学習モデルでの意味的分割、信号機検出、及び分岐路検出のそれぞれの不確実性とすればよい。

　コントローラ部１０４ｂは、不確実性予測部１０４２ｂで予測するデータの不確実性及びモデルの不確実性も用いて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更する。コントローラ部１０４ｂは、データ及びモデルの不確実性の大きさの度合いにも応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更すればよい。データ及びモデルの不確実性のそれぞれの大きさの度合いは、実施形態２で述べたような不確実性が大きいレベルと不確実性が小さいレベルとの２段階であってもよい。コントローラ部１０４ｂは、データ及びモデルのそれぞれの不確実性の高さの度合いの組み合わせごとに適した、複数の画像認識タスクの処理内容に変更すればよい。コントローラ部１０４ａは、データ及びモデルのそれぞれの不確実性の高さの度合いの組み合わせごとに適した、複数の画像認識タスクの処理内容を、機械学習によって学習しておけばよい。以上の構成によれば、データの不確実性及びモデルの不確実性に応じて適した画像認識タスクの処理を行わせることが可能になる。

　なお、不確実性予測部１０４２ｂは、データの不確実性及びモデルの不確実性のうちのモデルの不確実性のみを予測する構成としてもよい。この場合、コントローラ部１０４ｂは、モデルの不確実性の大きさの度合いにも応じて、検出器１０３での複数の画像認識タスクの処理内容を動的に変更する構成とすればよい。この構成によっても、モデルの不確実性に応じて適した画像認識タスクの処理を行わせることが可能になる。モデルの不確実性に応じて適した画像認識タスクの処理の例としては、意味的分割、信号機検出、及び分岐路検出のうちの難しいタスクに多くのリソースを割く処理が挙げられる。

　（実施形態４）
　前述の実施形態では、画像認識装置１０，１０ａ，１０ｂを車両に備える場合を例に挙げて説明したが、必ずしもこれに限らない。画像認識装置１０，１０ａ，１０ｂは、車外に備えられる構成としてもよい。例えば、車外のサーバに備えられる構成としてもよい。この場合、車両側のシステムとサーバの画像認識装置１０，１０ａ，１０ｂとの通信は、車両に備えられる通信モジュールを介して行う構成とすればよい。

　（実施形態５）
　前述の実施形態では、画像認識装置１０，１０ａ，１０ｂが、車両の周辺監視カメラ１４１で撮像した周辺画像の画像認識に用いられる場合を例に挙げて説明したが、必ずしもこれに限らない。画像認識装置１０，１０ａ，１０ｂは、車両の周辺監視カメラ１４１で撮像した周辺画像以外の周辺画像の画像認識に用いる構成としてもよい。例えば、ドローン等の移動体にカメラで撮像した周辺画像の画像認識に用いてもよい。他にも、施設に設置されるカメラで撮像した周辺画像の画像認識に用いてもよい。また、前述の実施形態では、画像認識に用いる画像として、周辺画像を用いる例を挙げたが、必ずしもこれに限らない。画像認識に用いる画像は、内容の傾向がシーンに相関性を有する画像であれば、周辺画像以外の画像であってもよい。

　（実施形態６）
　前述の実施形態では、コントローラ部１０４，１０４ａ，１０４ｂが、検出器１０３のネットワーク構造を制御することで、周辺画像の内容の傾向に応じた複数の画像認識タスクの処理の動的な変更を行う場合を例に挙げて説明したが、必ずしもこれに限らない。例えば、検出器１０３としては、人のデザインによって、複数の画像認識タスクの処理のパターンの異なる検出器１０３を予め複数用意しておく構成としてもよい。そして、コントローラ部１０４，１０４ａ，１０４ｂは、この複数の検出器１０３を選択することで、複数の画像認識タスクの処理の動的な変更を行う構成としてもよい。なお、予め用意しておく複数の検出器１０３のネットワーク構造及びパラメータは、図５で説明したコントローラ部１０４の学習時に、併せて学習を行ってもよい。

　なお、本開示は、上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本開示の技術的範囲に含まれる。また、本開示に記載の制御部及びその手法は、コンピュータプログラムにより具体化された１つ乃至は複数の機能を実行するようにプログラムされたプロセッサを構成する専用コンピュータにより、実現されてもよい。あるいは、本開示に記載の装置及びその手法は、専用ハードウェア論理回路により、実現されてもよい。もしくは、本開示に記載の装置及びその手法は、コンピュータプログラムを実行するプロセッサと１つ以上のハードウェア論理回路との組み合わせにより構成された１つ以上の専用コンピュータにより、実現されてもよい。また、コンピュータプログラムは、コンピュータにより実行されるインストラクションとして、コンピュータ読み取り可能な非遷移有形記録媒体に記憶されていてもよい。

　（開示されている技術的思想）
　この明細書は、以下に列挙された複数の項に記載された複数の技術的思想を開示している。いくつかの項は、後続の項において先行する項を択一的に引用する多項従属形式（a multiple dependent form）により記載されている場合がある。さらに、いくつかの項は、他の多項従属形式の項を引用する多項従属形式（a multiple dependent form referring to another multiple dependent form）により記載されている場合がある。これらの多項従属形式で記載された項は、複数の技術的思想を定義している。

　（技術的思想１）
　画像に対して複数の画像認識タスクを実行するマルチタスク処理が可能であって、且つ、画像認識タスクの処理内容の調整が可能な画像処理部（１０３）と、
　前記画像処理部での複数の画像認識タスクの処理内容を調整するコントローラ部（１０４，１０４ａ，１０４ｂ）とを備え、
　前記コントローラ部は、前記画像を入力として、その画像の内容の傾向に応じて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。

　（技術的思想２）
　技術的思想１に記載の画像認識装置であって、
　前記コントローラ部は、前記画像の内容の傾向に応じて、与えられる処理時間の制約に対して複数の画像認識タスクの各々の処理精度が最大化するように、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。

　（技術的思想３）
　技術的思想１に記載の画像認識装置であって、
　前記コントローラ部は、前記画像の内容の傾向に応じて、与えられる処理精度の制約に対して複数の画像認識タスクの各々の処理速度の合計が最小化するように、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。

　（技術的思想４）
　技術的思想１に記載の画像認識装置であって、
　前記コントローラ部は、前記画像の内容の傾向に応じて、与えられる処理精度の制約に対して複数の画像認識タスクの各々のハードウェアリソースの使用量の合計が最小化するように、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。

　（技術的思想５）
　技術的思想１～４のいずれか１項に記載の画像認識装置であって、
　前記コントローラ部は、前記画像を入力として前記画像の内容が示すシーンを分類するシーン分類部（１０４１）を有し、
　前記コントローラ部は、前記画像の内容の傾向として、前記シーン分類部で分類したシーンに応じて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。

　（技術的思想６）
　技術的思想５に記載の画像認識装置であって、
　前記コントローラ部は、前記シーン分類部で分類するシーンの不確実性を予測する第１不確実性予測部（１０４２）をさらに有し、
　前記コントローラ部は、前記第１不確実性予測部で予測するシーンの不確実性も用いて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。

　（技術的思想７）
　技術的思想１～５のいずれか１項に記載の画像認識装置であって、
　前記画像処理部は、前記マルチタスク処理を、機械学習モデルを用いて行うものであり、
　前記コントローラ部は、前記コントローラ部に入力される前記画像に関する不確実性と前記機械学習モデルの不確実性の少なくともいずれかの不確実性を予測する第２不確実性予測部（１０４２ｂ）を有し、
　前記コントローラ部は、前記第２不確実性予測部で予測する不確実性も用いて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。

　（技術的思想８）
　技術的思想１～７のいずれか１項に記載の画像認識装置であって、
　前記画像処理部は、前記マルチタスク処理を、機械学習モデルのうちのニューラルネットワークを用いて行うものであり、
　前記コントローラ部は、前記ニューラルネットワークのネットワーク構造及びパラメータのうちの少なくともいずれかを変更することで、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。

　（技術的思想９）
　技術的思想１～８のいずれか１項に記載の画像認識装置であって、
　前記画像処理部は、車両の周辺を撮像する周辺監視カメラ（１４１）で撮像した画像である周辺画像に対して複数の画像認識タスクを実行するマルチタスク処理が可能なものであり、
　前記コントローラ部は、前記周辺画像を入力として、その周辺画像の内容の傾向に応じて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。

Claims

　画像に対して複数の画像認識タスクを実行するマルチタスク処理が可能であって、且つ、画像認識タスクの処理内容の調整が可能な画像処理部（１０３）と、
　前記画像処理部での複数の画像認識タスクの処理内容を調整するコントローラ部（１０４，１０４ａ，１０４ｂ）とを備え、
　前記コントローラ部は、前記画像を入力として、その画像の内容の傾向に応じて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。
　請求項１に記載の画像認識装置であって、
　前記コントローラ部は、前記画像の内容の傾向に応じて、与えられる処理時間の制約に対して複数の画像認識タスクの各々の処理精度が最大化するように、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。
　請求項１に記載の画像認識装置であって、
　前記コントローラ部は、前記画像の内容の傾向に応じて、与えられる処理精度の制約に対して複数の画像認識タスクの各々の処理速度の合計が最小化するように、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。
　請求項１に記載の画像認識装置であって、
　前記コントローラ部は、前記画像の内容の傾向に応じて、与えられる処理精度の制約に対して複数の画像認識タスクの各々のハードウェアリソースの使用量の合計が最小化するように、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。
　請求項１～４のいずれか１項に記載の画像認識装置であって、
　前記コントローラ部は、前記画像を入力として前記画像の内容が示すシーンを分類するシーン分類部（１０４１）を有し、
　前記コントローラ部は、前記画像の内容の傾向として、前記シーン分類部で分類したシーンに応じて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。
　請求項５に記載の画像認識装置であって、
　前記コントローラ部は、前記シーン分類部で分類するシーンの不確実性を予測する第１不確実性予測部（１０４２）をさらに有し、
　前記コントローラ部は、前記第１不確実性予測部で予測するシーンの不確実性も用いて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。
　請求項１に記載の画像認識装置であって、
　前記画像処理部は、前記マルチタスク処理を、機械学習モデルを用いて行うものであり、
　前記コントローラ部は、前記コントローラ部に入力される前記画像に関する不確実性と前記機械学習モデルの不確実性の少なくともいずれかの不確実性を予測する第２不確実性予測部（１０４２ｂ）を有し、
　前記コントローラ部は、前記第２不確実性予測部で予測する不確実性も用いて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。
　請求項１に記載の画像認識装置であって、
　前記画像処理部は、前記マルチタスク処理を、機械学習モデルのうちのニューラルネットワークを用いて行うものであり、
　前記コントローラ部は、前記ニューラルネットワークのネットワーク構造及びパラメータのうちの少なくともいずれかを変更することで、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。
　請求項１に記載の画像認識装置であって、
　前記画像処理部は、車両の周辺を撮像する周辺監視カメラ（１４１）で撮像した画像である周辺画像に対して複数の画像認識タスクを実行するマルチタスク処理が可能なものであり、
　前記コントローラ部は、前記周辺画像を入力として、その周辺画像の内容の傾向に応じて、前記画像処理部での複数の画像認識タスクの処理内容を動的に変更する画像認識装置。
　少なくとも１つのプロセッサにより実行される、
　画像に対して複数の画像認識タスクを実行するマルチタスク処理が可能であって、且つ、画像認識タスクの処理内容の調整が可能な画像処理工程と、
　前記画像処理工程での複数の画像認識タスクの処理内容を調整するコントローラ工程とを含み、
　前記コントローラ工程では、前記画像を入力として、その画像の内容の傾向に応じて、前記画像処理工程での複数の画像認識タスクの処理内容を動的に変更する画像認識方法。