A inteligência artificial (IA) não apenas oferece um desempenho impressionante, mas também demanda uma quantidade significativa de energia. Quanto mais complexas forem as tarefas que ela realiza, maior será o consumo de energia. Os cientistas Víctor López-Pastor e Florian Marquardt, do Instituto Max Planck para a Ciência da Luz, desenvolveram um método para um treinamento mais eficiente da IA. Seu método utiliza processos físicos, divergindo das tradicionais redes neurais artificiais digitais.
A OpenAI, empresa responsável pelo desenvolvimento do GPT-3, a tecnologia que alimenta o ChatGPT, não divulgou a quantidade de energia necessária para o treinamento desse Chatbot de IA avançado e bem informado.
De acordo com a empresa alemã de estatísticas Statista, isso exigiria 1.000 megawatts-hora. Embora esse gasto de energia tenha permitido ao GPT-3 saber se a palavra “profundo” tem maior probabilidade de ser seguida pela palavra “mar” ou “aprendizado” em seus conjuntos de dados, ele não entendeu o significado subjacente de tais frases.
Redes neurais em computadores neuromórficos
Para reduzir o consumo de energia dos computadores e, principalmente, dos aplicativos de IA, nos últimos anos, várias instituições de pesquisa têm investigado um conceito totalmente novo de como os computadores poderão processar dados no futuro. O conceito é conhecido como computação neuromórfica. Embora pareça semelhante às redes neurais artificiais, na verdade tem pouco a ver com elas, pois as redes neurais artificiais são executadas em computadores digitais convencionais;
Isso significa que o software, ou mais precisamente o algoritmo, é modelado com base no modo de funcionamento do cérebro, mas os computadores digitais servem como hardware. Eles executam as etapas de cálculo da rede neuronal em sequência, uma após a outra, diferenciando entre processador e memória;
“A transferência de dados entre esses dois componentes por si só consome grandes quantidades de energia quando uma rede neural treina centenas de bilhões de parâmetros, ou seja, sinapses, com até um terabyte de dados”, diz Florian Marquardt, diretor do Instituto Max Planck para a Ciência da Luz e professor da Universidade de Erlangen.
O cérebro humano é totalmente diferente e provavelmente nunca teria sido evolutivamente competitivo se tivesse funcionado com uma eficiência energética semelhante à dos computadores com transistores de silício. Ele provavelmente teria falhado devido ao superaquecimento;
O cérebro é caracterizado por realizar as várias etapas de um processo de pensamento em paralelo e não sequencialmente. As células nervosas, ou mais precisamente as sinapses, são tanto o processador quanto a memória combinados. Vários sistemas em todo o mundo estão sendo tratados como possíveis candidatos a contrapartes neuromórficas das nossas células nervosas, incluindo circuitos fotônicos que utilizam luz em vez de elétrons para realizar cálculos. Seus componentes servem simultaneamente como interruptores e células de memória.
Uma máquina física de autoaprendizagem otimiza suas sinapses de forma independente
Juntamente com Víctor López-Pastor, um estudante de doutorado do Instituto Max Planck para a Ciência da Luz, Florian Marquardt agora desenvolveu um método de treinamento eficiente para computadores neuromórficos .
“Desenvolvemos o conceito de uma máquina física de autoaprendizagem explica Florian Marquardt. “A ideia central é realizar o treinamento na forma de um processo físico, no qual os parâmetros da máquina são otimizados pelo próprio processo.”
Ao treinar redes neurais artificiais convencionais , é necessário um feedback externo para ajustar os pontos fortes dos muitos bilhões de conexões sinápticas.
“Não exigir esse feedback torna o treinamento muito mais eficiente”, diz Florian Marquardt. A implementação e o treinamento de uma inteligência artificial em uma máquina física de autoaprendizagem não só economizariam energia, mas também tempo de computação. “Nosso método funciona independentemente do processo físico que ocorre na máquina de autoaprendizagem, e nem mesmo precisamos saber o processo exato”, explica Florian Marquardt. “No entanto, o processo deve atender a algumas condições.”
O mais importante é que ele deve ser reversível, o que significa que deve ser capaz de funcionar para frente ou para trás com um mínimo de perda de energia.
“Além disso, o processo físico deve ser não linear, ou seja, suficientemente complexo”, diz Florian Marquardt. Somente os processos não lineares podem realizar as transformações complicadas entre os dados de entrada e os resultados. Uma bola de pinball rolando sobre um prato sem colidir com outra é uma ação linear. Entretanto, se ela for perturbada por outra, a situação se torna não linear.
Teste prático em um computador neuromórfico óptico
Exemplos de processos reversíveis e não lineares podem ser encontrados na óptica. De fato, Víctor López-Pastor e Florian Marquardt já estão colaborando com uma equipe experimental que desenvolve um computador neuromórfico óptico. Essa máquina processa informações na forma de ondas de luz sobrepostas, em que componentes adequados regulam o tipo e a intensidade da interação. O objetivo dos pesquisadores é colocar em prática o conceito de máquina física de autoaprendizagem.
“Esperamos poder apresentar a primeira máquina física de autoaprendizagem em três anos”, diz Florian Marquardt. Até lá, deverá haver redes neurais que pensam com muito mais sinapses e são treinadas com quantidades significativamente maiores de dados do que as atuais.
Como consequência, provavelmente haverá um desejo ainda maior de implementar redes neurais fora dos computadores digitais convencionais e de substituí-los por computadores neuromórficos treinados de forma eficiente. “Portanto, estamos confiantes de que as máquinas físicas de autoaprendizagem têm uma grande chance de serem usadas no desenvolvimento futuro da inteligência artificial”, diz o físico.
A pesquisa foi publicada na revista Physical Review X.