Traduzindo Latidos: Inteligência Artificial Desvenda A Linguagem Canina

0
238

Os pesquisadores estão explorando a possibilidade de entender o que o cão está tentando comunicar aos humanos, desenvolvendo ferramentas que podem identificar se o latido de um cão transmite brincadeira ou agressão. Os mesmos modelos também podem extrair outras informações das vocalizações animais, como idade, raça e sexo do animal. O Instituto Nacional de Astrofísica, Óptica e Eletrônica (INAOE) do México, o estudo descobriu que modelos de IA originalmente treinados em fala humana podem ser usados como ponto de partida para treinar novos sistemas que visam a comunicação animal. Os resultados foram apresentados na Conferência Internacional Conjunta sobre Linguística Computacional, Recursos Linguísticos e Avaliação.

“Usando modelos de processamento de fala inicialmente treinados em fala humana, nossa pesquisa abre uma nova janela sobre como podemos aproveitar o que construímos até agora no processamento de fala para começar a entender as nuances dos latidos de cães”, disse Rada Mihalcea, a Professora Colegiada Janice M. Jenkins de Ciência da Computação e Engenharia e diretora do Laboratório de IA da U-M. “Há muito que ainda não sabemos sobre os animais que compartilham este mundo conosco. Avanços em IA podem ser usados para revolucionar nossa compreensão da comunicação animal, e nossas descobertas sugerem que talvez não precisemos começar do zero.” Um dos obstáculos predominantes para desenvolver modelos de IA que possam analisar vocalizações animais é a falta de dados publicamente disponíveis.

Enquanto existem numerosos recursos e oportunidades para gravar fala humana, coletar esses dados de animais é mais difícil. “Vocalizações animais são logisticamente muito mais difíceis de solicitar e gravar”, disse Artem Abzaliev, autor principal e estudante de doutorado da U-M em ciência da computação e engenharia. “Eles devem ser gravados passivamente na natureza ou, no caso de animais de estimação domésticos, com permissão dos proprietários.” Devido a essa escassez de dados utilizáveis, técnicas para analisar vocalizações de cães têm sido difíceis de desenvolver, e aquelas que existem são limitadas pela falta de material de treinamento. Os pesquisadores superaram esses desafios ao reutilizarem um modelo existente que foi originalmente projetado para analisar fala humana.

Essa abordagem permitiu que os pesquisadores aproveitassem modelos robustos que formam a espinha dorsal das várias tecnologias habilitadas para voz que usamos hoje, incluindo voz para texto e tradução de idiomas. Esses modelos são treinados para distinguir nuances na fala humana, como tom, altura e sotaque, e converter essas informações em um formato que um computador pode usar para identificar quais palavras estão sendo ditas, reconhecer o indivíduo falando e muito mais. “Esses modelos são capazes de aprender e codificar os padrões incrivelmente complexos da linguagem e fala humana”, disse Abzaliev. “Queríamos ver se poderíamos aproveitar essa capacidade para discernir e interpretar os latidos de cães.” Os pesquisadores usaram um conjunto de dados de vocalizações de cães gravadas de 74 cães de raças, idades e sexos variados, em uma variedade de contextos.

Humberto Pérez-Espinosa, um colaborador do INAOE, liderou a equipe que coletou o conjunto de dados. Então usou as gravações para modificar um modelo de aprendizado de máquina – um tipo de algoritmo de computador que identifica padrões em grandes conjuntos de dados. A equipe escolheu um modelo de representação de fala chamado Wav2Vec2, que foi originalmente treinado em dados de fala humana. Com este modelo, os pesquisadores conseguiram gerar representações dos dados acústicos coletados dos cães e interpretar essas representações. Eles descobriram que o Wav2Vec2 não só teve sucesso em quatro tarefas de classificação; também superou outros modelos treinados especificamente em dados de latidos de cães, com índices de precisão de até 70%.

“Esta é a primeira vez que técnicas otimizadas para fala humana foram construídas para ajudar na decodificação da comunicação animal”, disse Mihalcea. “Nossos resultados mostram que os sons e padrões derivados da fala humana podem servir como uma base para analisar e entender os padrões acústicos de outros sons, como vocalizações animais.” Além de estabelecer modelos de fala humana como uma ferramenta útil na análise da comunicação animal – o que poderia beneficiar biólogos, comportamentalistas animais e outros – esta pesquisa tem implicações importantes para o bem-estar animal. Entender as nuances das vocalizações de cães poderia melhorar muito como os humanos interpretam e respondem às necessidades emocionais e físicas dos cães, melhorando assim seu cuidado e prevenindo situações potencialmente perigosas, afirmaram os pesquisadores.

Artigo anteriorGDF e Natiruts se unem em solidariedade à população do Rio Grande do Sul
Próximo artigoSe deu mal – Ladrão é rendido por lutadores de jiu-jítsu e apanha de mulher Veja o vídeo