WO2025158547A1

WO2025158547A1 - Dispositif d'apprentissage, dispositif d'inférence, procédé d'apprentissage, procédé d'inférence et programme

Info

Publication number: WO2025158547A1
Application number: PCT/JP2024/001906
Authority: WO
Inventors: 厚志安藤; 岳至森
Original assignee: Nippon Telegraph and Telephone Corp; NTT Inc USA
Current assignee: NTT Inc; NTT Inc USA
Priority date: 2024-01-23
Filing date: 2024-01-23
Publication date: 2025-07-31
Anticipated expiration: 2026-07-23

Abstract

Ce dispositif d'apprentissage comprend : une unité d'entrée pour entrer des données d'apprentissage comprenant de la parole, une première phrase concernant la parole, et une seconde phrase correspondant à la première phrase ; une unité de génération de caractéristiques vocales qui génère des informations représentant des caractéristiques de la parole pour chaque intervalle de temps prescrit, sur la base d'un extracteur de caractéristiques vocales composé d'une pluralité de couches ; une première unité d'intégration qui, sur la base d'un premier paramètre, génère des premières informations intégrées pour chaque intervalle de temps en intégrant des informations représentant des caractéristiques générées individuellement dans une pluralité prescrite de couches de l'extracteur de caractéristiques vocales ; une seconde unité d'intégration qui, sur la base d'un second paramètre, génère des secondes informations intégrées par intégration des premières informations intégrées pour chaque intervalle de temps dans la direction temporelle ; une unité de calcul qui calcule la probabilité de génération d'une troisième phrase correspondant à la première phrase sur la base de la première phrase, des secondes informations intégrées et d'un modèle de langage ; et une unité d'apprentissage qui apprend des paramètres à apprendre, comprenant le premier paramètre et le deuxième paramètre, sur la base de la probabilité de génération de la troisième phrase, et de la deuxième phrase.