O Recognizer é uma API para criação de aplicações de voz que utilizam o servidor CPqD ASR para reconhecimento de fala.
Para maiores informações, consulte a documentação do projeto.
Os códigos de exemplo estão sob o diretório sample-app
Baixe o conteúdo do repositório em seu computador usando o comando abaixo:
# git clone https://github.com/CPqD/asr-sdk-kotlin.git
Abra o projeto recognizer no Android Studio e gere o arquivo aar contendo a biblioteca
# Build > Make Project
Adicione o arquivo aar ao seu projeto como uma depêndencia
# File > Project Structure > Dependencies
Devemos inicialmente definir qual modelo de fala que utilizamos.
val languageModelList: LanguageModelList = LanguageModelList.Builder()
.addFromURI("builtin:slm/general")
.build()
A seguir definimos os parametros de configuração.
val recognitionConfig: RecognitionConfig = RecognitionConfig.Builder()
.accept(ContentTypeConstants.TYPE_JSON)
.contentType(ContentTypeConstants.TYPE_URI_LIST)
.waitEndMilis(2000)
.noInputTimeoutMilis(20000)
.continuousMode(true)
.build()
E por fim criaremos a instância de reconhecimento de fala
val speech = SpeechRecognizer.Builder()
.serverURL("wss://speech.cpqd.com.br/asr/ws/v2/recognize/8k")
.credentials(user, password)
.config(recognitionConfig, languageModelList)
.build()
Para utilizar devemos chamar o método de reconhecimento de fala, passando como parametro um arquivo e ou um stream de audio, em formato PCM ou WAV.
val audio = FileAudioSource(applicationContext.assets.open(fileAudio))
speech.recognizer(audio, TYPE_OCTET_STREAM)