WO2025166250A1

WO2025166250A1 - Apprentissage de représentations visuelles à l'aide d'une auto-attention et d'un débruitage

Info

Publication number: WO2025166250A1
Application number: PCT/US2025/014146
Authority: WO
Inventors: Yazhe LI; Jörg BORNSCHEIN; Ting Chen
Original assignee: DeepMind Technologies Ltd; Gdm Holding LLC
Current assignee: DeepMind Technologies Ltd; Gdm Holding LLC
Priority date: 2024-02-01
Filing date: 2025-01-31
Publication date: 2025-08-07
Anticipated expiration: 2026-08-01

Abstract

L'invention concerne des systèmes, des procédés et un code de programme informatique pour entraîner des systèmes de réseau neuronal de génération d'image afin de générer de bonnes représentations d'image à l'aide d'une auto-attention. Des modes de réalisation des systèmes prédisent des incorporations de partie d'image de manière autorégressive et s'entraînent à une tâche de débruitage, en particulier à l'aide d'un objectif de modèle de diffusion. L'invention concerne également des systèmes de traitement d'image qui utilisent les représentations d'image générées.