Pesquisadores decifram línguas perdidas usando Inteligência Artificial

Matheus Gouveia

Pesquisadores desenvolveram um sistema à base de inteligência artificial com aprendizado de máquina para ajudar linguistas a decifrar textos antigos, em línguas perdidas que ficaram esquecidas na história.

Decifrando idiomas perdidos


A ciência sugere que a maioria das línguas que já existiram não são mais faladas. Muitas dessas línguas mortas também são consideradas perdidas, já que não as entendemos. Nós não sabemos, portanto, o suficiente sobre sua gramática, seu vocabulário ou sua sintaxe para conseguirmos compreender textos. Assim, sem entender registros históricos escritos nessas línguas, perdemos muito conhecimento do passado.

Mas agora pesquisadores do MIT fizeram um sistema à base de aprendizado de máquina – ou machine learning – que se mostrou capaz de decifrar línguas perdidas. Portanto, a equipe tem o objetivo final de fazer um sistema capaz de decifrar idiomas perdidos usando “apenas” alguns milhares de palavras.

LEIA TAMBÉM: Antigos imperadores romanos “renascem” por meio de Inteligência artificial

Padrões de mudança de linguagem

Liderado pela professora Regina Barzilay do MIT, o estudo se baseia em percepções da linguística histórica, como o fato de que as línguas geralmente só evoluem de maneiras previsíveis. Ou seja, embora um determinado idioma raramente adicione ou exclua totalmente um som, é provável que ocorram substituições de som; a letra “p” pode mudar para um “b” em algumas palavras ao longo do tempo, por exemplo.

Ao considerar restrições linguísticas como essa, Barzilay e seu aluno de doutorado, Jiaming Luo, desenvolveram então um algoritmo que permite capturar padrões de mudança de linguagem. O sistema pode, assim, segmentar palavras em um idioma antigo e mapeá-las em um idioma relacionado.

No passado, Barzilay e Luo escreveram um programa que decifrou as línguas mortas do ugarítico e do Linear B, o que motivou a pesquisa atual. O novo algoritmo pode, inclusive, avaliar a proximidade entre duas línguas. Em trabalhos futuros, a equipe espera expandir seu trabalho decifrando línguas sem precisar relacionar palavras a uma linguagem conhecida. De acordo com a autora do estudo, a grande questão é se essa tarefa será viável sem quaisquer dados de treinamento na língua antiga.

Inteligência artificial e aprendizado de máquina

A inteligência artificial (IA) surgiu quando cientistas perceberam a capacidade das máquinas de interpretar dados e aprender a partir deles. Nos anos 60, essa teoria levou o Departamento de Defesa dos EUA a investir na tecnologia, treinando computadores para imitar o raciocínio humano básico.

Talvez um dos exemplos maios famosos de IA é o supercomputador Deep Blue, que derrotou Garry Kasparov, um dos maiores enxadristas de todos os tempos, no xadrez.

LEIA TAMBÉM: Inteligência artificial pode revelar o que uma pessoa está pensando

Dentro da IA, está a vertente do aprendizado de máquina, que parte do princípio que máquinas podem aprender de forma semelhante aos humanos, obtendo maior índice de acertos conforme a experiência.

O aprendizado de máquina se propõe a treinar máquinas para aprenderem com dados, e é a partir dos estudos nesse ramo que várias tecnologias de hoje são possíveis; entre elas, detecção de fraudes em bancos, veículos autônomos, reconhecimento facial e mensagens inteligentes.

Compartilhar