JP7765671B1 - 情報処理方法、コンピュータプログラム及び情報処理装置 - Google Patents
情報処理方法、コンピュータプログラム及び情報処理装置Info
- Publication number
- JP7765671B1 JP7765671B1 JP2025105742A JP2025105742A JP7765671B1 JP 7765671 B1 JP7765671 B1 JP 7765671B1 JP 2025105742 A JP2025105742 A JP 2025105742A JP 2025105742 A JP2025105742 A JP 2025105742A JP 7765671 B1 JP7765671 B1 JP 7765671B1
- Authority
- JP
- Japan
- Prior art keywords
- image
- test
- model
- image recognition
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】本実施の形態に係る情報処理方法は、情報処理装置が、テスト対象の画像認識モデルに対するテスト条件を基に、画像生成モデルを用いてテスト画像を生成し、生成した前記テスト画像を前記画像認識モデルへ入力して、前記画像認識モデルによる画像認識結果を取得し、取得した前記画像認識結果に含まれる誤認識結果を基に、言語モデルを用いて次のテスト条件を生成する。
【選択図】図4
Description
本実施の形態に係る情報処理システムは、誤認識を引き起こしやすそうであるテスト条件の生成と評価とを繰り返し実行することで、誤認識率が高いテスト条件を探索する。テスト条件の生成には、例えばユーザの入力に対して応答を生成可能なチャットベースのLLM(Large Language Model、大規模言語モデル)が用いられる。情報処理システムは、生成したテスト条件を基に、画像生成モデルを用いてテストケース画像を複数生成し、これらテストケース画像の誤認識率を測定することでテスト条件の評価を行う。また本実施の形態に係る情報処理システムは、誤認識を引き起こしやすいテスト条件を生成するため、過去にどのようなテスト条件の画像をどのクラスであると誤認識したのかについての情報(誤認識先クラス情報)をLLMに与えてテスト条件を生成する。
図3は、本実施の形態に係る情報処理装置の一構成例を示すブロック図である。本実施の形態に係る情報処理装置1は、本実施の形態に係る情報処理装置1は、例えばパーソナルコンピュータ又はサーバコンピュータ等の汎用的な情報処理装置に所定のアプリケーションプログラム等をインストールすることにより実現され得る。本実施の形態に係る情報処理装置1は、処理部11、記憶部12、通信部13、表示部14及び操作部15等を備えて構成されている。なお本実施の形態においては、1つの情報処理装置1にて処理が行われるものとして説明を行うが、情報処理装置1の処理を複数の装置が分散して行ってもよい。
{datas: [{
context_en: "{A fire engine is driving through a flooded street.}",
context_jp: "{消防車が浸水した通りを走っている}“}
, ... ]}というサンプルのjson形式と同じ形式で列挙してください。json出力以外は何も発言しないでください。
」の指示が含まれている。この指示は、実例を用いてテスト条件を列挙する例を記載することで、LLM102に対してテスト条件の粒度及び出力形式等を指示している。
図6は、本実施の形態に係る情報処理装置1が行う処理の手順の一例を示すフローチャートである。本実施の形態に係る情報処理装置1の処理部11の初期条件受付部11aは、テスト対象の画像認識モデルに対して最初に行うテストの条件を、初期テスト条件としてユーザから受け付ける(ステップS1)。またステップS1において初期条件受付部11aは、初期テスト条件と共に、テスト対象クラスの情報及び探索の終了条件等の入力を受け付ける。
上述の実施形態においては、テスト対象の画像認識モデルとして、入力された画像を複数のクラスに分類する分類モデルが用いられる場合について説明を行った。しかしながら本実施の形態に係る情報処理システムは、分類モデル以外の画像認識モデルをテスト対象とする場合にも適用可能である。
変形例1に係る情報処理システムは、テスト対象の画像認識モデルとして、入力された画像に写された対象物を検出する物体検出モデルが用いられる。変形例1に係る物体検出モデルは、画像を入力として受け付けて、この画像に写された一又は複数の物体について、各物体の位置及び種類(クラス)を示す情報を出力する。各物体の位置は、例えばこの物体を囲む矩形枠(バウンディングボックス)の頂点の座標として表される。変形例1に係る情報処理装置1は、テスト画像を物体検出モデルへ入力し、物体の検出結果として位置及び種類を示す情報を物体検出モデルから取得する。情報処理装置1は、テスト画像に対応付けられた位置及び種類の正解値と、物体検出モデルから検出結果として取得した位置及び種類とを比較し、検出した物体の位置の正否及び種類の正否をそれぞれ判定する。情報処理装置1は、検出した物体の位置と正解値との差が所定の閾値を超える場合、又は、検出した物体の種類が正解値とは異なる場合に、誤検出(誤認識)が生じたと判定することができる。情報処理装置1は、これらの判定結果を基に誤認識率を算出すると共に、上述のものと同様の誤認識先クラス情報と、誤検出した物体の位置に関する誤認識位置情報とを生成して、これら誤検出結果の情報と実施したテスト条件の情報とを有するノードを探索木に追加する。変形例1に係る情報処理装置1は、探索木の各ノードが有するテスト条件、誤認識率、誤認識先クラス情報及び誤認識位置情報等に基づいてLLM102に次のテスト条件を生成させることができる。
変形例2に係る情報処理システムは、テスト対象の画像認識モデルとして、入力された画像を基に数値を予測する回帰モデルが用いられる。変形例2に係る回帰モデルは、例えば車載カメラにより撮影された画像を基に自動車の舵角を推定するなど、画像を入力として受け付けて、この画像に関連する数値を出力する。変形例2に係る情報処理装置1は、テスト画像を回帰モデルへ入力し、画像に応じた所定の数値の予測値を回帰モデルから取得する。情報処理装置1は、テスト画像に対応付けられた数値の正解値と、回帰モデルから予測結果として取得した数値とを比較し、予測値と正解値との誤差が所定の閾値を超える場合に、誤予測(誤認識)が生じたと判定することができる。情報処理装置1は、この判定結果を基に誤認識率を算出すると共に、誤認識した数値に関する誤認識数値情報を生成して、これらの情報と実施したテスト条件の情報とを有するノードを探索木に追加する。変形例2に係る情報処理装置1は、探索木の各ノードが有するテスト条件、誤認識率及び誤認識数値情報等に基づいてLLM102に次のテスト条件を生成させることができる。
変形例3に係る情報処理システムは、テスト対象の画像認識モデルとして、入力された画像の各画素について写された物体の種類(クラス)を分類するセグメンテーションモデルが用いられる。変形例3に係るセグメンテーションモデルは、例えばM画素×N画素のサイズの画像を入力として受け付けて、この画像の各画素のクラスを分類したM×N個の分類結果を出力する(M,Nは正の整数)。変形例3に係る情報処理装置1は、テスト画像をセグメンテーションモデルへ入力し、画像の各画素の分類結果をセグメンテーションモデルから取得する。情報処理装置1は、テスト画像の各画素の種類の正解値と、セグメンテーションモデルから取得した各画素の分類結果とを比較し、例えば分類結果が誤っている画素数が所定の閾値を超える場合に、誤認識が生じたと判定することができる。情報処理装置1は、この判定結果を基に誤認識率を算出すると共に、誤認識した画素がいずれであるか及びどのクラスに誤認識したか等を示す誤認識セグメンテーション情報を生成して、これらの情報と実施したテスト条件の情報とを有するノードを探索木に追加する。変形例3に係る情報処理装置1は、探索木の各ノードが有するテスト条件、誤認識率及び誤認識セグメンテーション情報等に基づいてLLM102に次のテスト条件を生成させることができる。
変形例4に係る情報処理システムは、テスト対象の画像認識モデルとして、入力された画像の各画素について奥行(深度)を推定する深度推定モデルが用いられる。変形例4に係る深度推定モデルは、例えばM画素×N画素のサイズの画像を入力として受け付けて、この画像の各画素の深度を推定したM×N個の推定値を出力する。変形例4に係る情報処理装置1は、テスト画像を深度推定モデルへ入力し、画像の各画素の深度推定結果を深度推定モデルから取得する。情報処理装置1は、テスト画像の各画素の深度の正解値と、深度推定モデルから取得した各画素の深度の推定値とを比較し、例えば深度の推定値と正解値との差が所定の第1閾値を超える画素の数が所定の第2閾値を超える場合に、誤認識が生じたと判定することができる。情報処理装置1は、この判定結果を基に誤認識率を算出すると共に、誤認識した画素がいずれであるか及び正解値に対する予測値の差がどの程度であってか等を示す誤認識深度情報を生成して、これらの情報と実施したテスト条件の情報とを有するノードを探索木に追加する。変形例4に係る情報処理装置1は、探索木の各ノードが有するテスト条件、誤認識率及び誤認識深度情報等に基づいてLLM102に次のテスト条件を生成させることができる。
以上の構成の本実施の形態に係る情報処理システムでは、情報処理装置1が、テスト対象の画像認識モデル100に対するテスト条件を基に画像生成モデル101を用いてテスト画像を生成し、生成したテスト画像を画像認識モデル100へ入力して画像認識結果を取得し、取得した画像認識結果に含まれる誤認識結果を基にLLM102を用いて次のテスト条件を生成する。これにより本実施の形態に係る情報処理システムは、テスト画像の生成、テストの評価及び次のテスト条件の生成を行うことができ、ユーザによる画像認識モデル100の系統的故障の分析を支援することが期待できる。
11 処理部
11a 初期条件受付部
11b 画像生成部
11c 性能評価部
11d 探索木管理部
11e 探索生成部
11f 表示処理部
12 記憶部
12a プログラム(コンピュータプログラム)
12b モデル情報記憶部
12c テスト条件記憶部
13 通信部
14 表示部
15 操作部
99 記録媒体
100 画像認識モデル
101 画像生成モデル
102 LLM
Claims (12)
- 情報処理装置が、
テスト対象の画像認識モデルに対するテスト条件を基に、画像生成モデルを用いてテスト画像を生成し、
生成した前記テスト画像を前記画像認識モデルへ入力して、前記画像認識モデルによる画像認識結果を取得し、
取得した前記画像認識結果に含まれる誤認識結果を基に、言語モデルを用いて次のテスト条件を生成する、
情報処理方法。 - テスト画像の生成に用いたテスト条件と、誤認識結果とを基に、複数のテスト条件を生成する命令を含むプロンプトを生成し、
生成した前記プロンプトを前記言語モデルへ入力して、複数のテスト条件を生成する、
請求項1に記載の情報処理方法。 - 複数のテスト条件に基づいて複数のテスト画像を生成し、
生成した前記複数のテスト画像に対する前記画像認識モデルの複数の画像認識結果を取得し、
取得した前記複数の画像認識結果から次のテスト条件の生成に用いる画像認識結果を選択する、
請求項2に記載の情報処理方法。 - テスト条件を基に画像生成のためのプロンプトを生成し、
生成した前記プロンプトを前記画像生成モデルへ入力して、前記画像生成モデルが出力する画像を前記テスト画像として取得する、
請求項1に記載の情報処理方法。 - 初期テスト条件、及び、テストの終了条件の入力を受け付け、
受け付けた前記初期テスト条件を基に前記テスト画像の生成、前記画像認識結果の取得及び前記次のテスト条件の生成の処理を行い、
生成した前記テスト条件を基に前記テスト画像の生成、前記画像認識結果の取得及び前記次のテスト条件の生成の処理を、受け付けた前記終了条件を満たすまで繰り返し行う、
請求項1に記載の情報処理方法。 - 前記画像認識モデルは、入力された画像を複数のクラスに分類した結果を出力する分類モデルであり、
前記誤認識結果として前記分類モデルが誤分類した複数のクラスの情報を取得し、
取得した前記情報を基に、前記言語モデルを用いて次のテスト条件を生成する、
請求項1に記載の情報処理方法。 - 前記画像認識モデルは、入力された画像に写された対象物を検出する検出モデルであり、
前記誤認識結果として前記検出モデルによる誤検出結果を取得し、
取得した前記誤検出結果を基に、前記言語モデルを用いて次のテスト条件を生成する、
請求項1に記載の情報処理方法。 - 前記画像認識モデルは、入力された画像に応じた数値を出力する回帰モデルであり、
前記誤認識結果として前記回帰モデルが出力した数値の誤差を取得し、
取得した前記誤差を基に、前記言語モデルを用いて次のテスト条件を生成する、
請求項1に記載の情報処理方法。 - 前記画像認識モデルは、入力された画像の各画素を複数のクラスに分類するセグメンテーションモデルであり、
前記誤認識結果として前記セグメンテーションモデルが誤分類した画素及びクラスの情報を取得し、
取得した前記情報を基に、前記言語モデルを用いて次のテスト条件を生成する、
請求項1に記載の情報処理方法。 - 前記画像認識モデルは、入力された画像の各画素の深度を推定する深度推定モデルであり、
前記誤認識結果として前記深度推定モデルが誤推定した画素及び深度の情報を取得し、
取得した前記情報を基に、前記言語モデルを用いて次のテスト条件を生成する、
請求項1に記載の情報処理方法。 - テスト対象の画像認識モデルに対するテスト条件を基に、画像生成モデルを用いてテスト画像を生成し、
生成した前記テスト画像を前記画像認識モデルへ入力して、前記画像認識モデルによる画像認識結果を取得し、
取得した前記画像認識結果に含まれる誤認識結果を基に、言語モデルを用いて次のテスト条件を生成する
処理をコンピュータに実行させるコンピュータプログラム。 - 処理部を備え、
前記処理部が、
テスト対象の画像認識モデルに対するテスト条件を基に、画像生成モデルを用いてテスト画像を生成し、
生成した前記テスト画像を前記画像認識モデルへ入力して、前記画像認識モデルによる画像認識結果を取得し、
取得した前記画像認識結果に含まれる誤認識結果を基に、言語モデルを用いて次のテスト条件を生成する、
情報処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2025105742A JP7765671B1 (ja) | 2025-06-23 | 2025-06-23 | 情報処理方法、コンピュータプログラム及び情報処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2025105742A JP7765671B1 (ja) | 2025-06-23 | 2025-06-23 | 情報処理方法、コンピュータプログラム及び情報処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP7765671B1 true JP7765671B1 (ja) | 2025-11-06 |
Family
ID=97560479
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2025105742A Active JP7765671B1 (ja) | 2025-06-23 | 2025-06-23 | 情報処理方法、コンピュータプログラム及び情報処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7765671B1 (ja) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20210117314A1 (en) * | 2018-08-30 | 2021-04-22 | International Business Machines Corporation | Automated test case generation for deep neural networks and other model-based artificial intelligence systems |
| JP2021124933A (ja) * | 2020-02-05 | 2021-08-30 | 株式会社日立製作所 | 画像を生成するシステム |
-
2025
- 2025-06-23 JP JP2025105742A patent/JP7765671B1/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20210117314A1 (en) * | 2018-08-30 | 2021-04-22 | International Business Machines Corporation | Automated test case generation for deep neural networks and other model-based artificial intelligence systems |
| JP2021124933A (ja) * | 2020-02-05 | 2021-08-30 | 株式会社日立製作所 | 画像を生成するシステム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12242957B2 (en) | Device and method for the generation of synthetic data in generative networks | |
| JP2022505762A (ja) | 画像セマンティックセグメンテーションネットワークのトレーニング方法、装置、機器及びコンピュータプログラム | |
| EP3796112B1 (en) | Virtual vehicle control method, model training method, control device and storage medium | |
| EP3462385A1 (en) | Sgcnn: structural graph convolutional neural network | |
| CN106845412B (zh) | 障碍物识别方法及装置、计算机设备及可读介质 | |
| CN110929802A (zh) | 基于信息熵的细分类识别模型训练、图像识别方法及装置 | |
| WO2019051941A1 (zh) | 车型识别方法、装置、设备及计算机可读存储介质 | |
| US11113574B1 (en) | Methods for performing self-supervised learning of deep-learning based detection network by using deep Q-network and devices using the same | |
| DK201770681A1 (en) | A method for (re-) training a machine learning component | |
| JP7573246B2 (ja) | 手書きにおける数学検出 | |
| CN106845416B (zh) | 障碍物识别方法及装置、计算机设备及可读介质 | |
| WO2021157330A1 (ja) | 計算機、識別器の学習方法、および分析システム | |
| CN113128284A (zh) | 一种多模态情感识别方法和装置 | |
| KR102103511B1 (ko) | 코드 생성 장치 및 방법 | |
| CN111429481B (zh) | 一种基于自适应表达的目标追踪方法、装置及终端 | |
| KR20230127739A (ko) | 포인트 클라우드 비라벨 데이터 셋트에 대한 자동 라벨링 방법 | |
| CN114003511A (zh) | 针对模型解释工具的评测方法和装置 | |
| JP7765671B1 (ja) | 情報処理方法、コンピュータプログラム及び情報処理装置 | |
| JP7293658B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
| CN118609073A (zh) | 驾驶场景的识别方法、装置、设备、存储介质和产品 | |
| CN113963322B (zh) | 一种检测模型训练方法、装置及电子设备 | |
| CN113362372B (zh) | 一种单目标追踪方法及计算机可读介质 | |
| KR20230172154A (ko) | 인공지능을 이용한 이미지 객체를 분할 방법 및 장치 | |
| CN116959078A (zh) | 疲劳检测模型的构建方法、疲劳检测方法及其装置 | |
| KR20140043225A (ko) | 기호 정보 제공 방법 및 장치 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20250723 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250909 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20250909 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20251021 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20251024 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7765671 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |