A modelagem 3D de proteínas resolvida por uma inteligência artificial

Mateus Marchetto
A empresa DeepMind está usando sua inteligência artificial para prever o formato de proteínas com mais de 90% de similaridade. (DrKjaergaard)

Dentro de cada célula existem milhões de proteínas. Essas biomoléculas são responsáveis por manter o andamento de praticamente todas as funções de um organismo. Portanto, entender o funcionamento das proteínas é também entender o funcionamento das células. Nesse sentido, a empresa DeepMind usou de inteligência artificial para resolver um problema antigo da biologia: o formato tridimensional de uma proteína.

PDB 1gme EBI
(Imagem de Jawahar Swaminathan)

Acontece que essas biomoléculas são bastante grandes. Muitas vezes, milhares de aminoácidos formam uma proteína. Nesse sentido, justamente por isso é tão difícil prever o formato desse tipo de molécula só com base apenas nos componentes. O que os pesquisadores fizeram foi utilizar a inteligência artificial da empresa para prever o formato das proteínas.

Os resultados, por conseguinte, foram de mais de 90% de similaridade entre o formato real e aquele proposto pela inteligência artificial. Esse tipo de previsão começou a entrar em teste nos anos 90. Aliás, até pouco tempo acreditava-se que a previsão tridimensional de proteínas levaria mais dezenas de anos até ser viável. As conclusões da DeepMind, portanto, representam uma revolução no estado da arte em bioinformática.

As proteínas funcionam tridimensionalmente

Talvez você já tenha ouvido falar que as proteínas funcionam sob um modelo de chave e fechadura. Ou seja, as proteínas e receptores se ligam entre si, mais ou menos como uma chave e uma fechadura. Contudo, o sistema real é bem mais complexo que isso. Reações com proteínas dependem de cascatas bioquímicas e condições bastante específicas. Essas variações permitem centenas de interações tridimensionais entre moléculas. Por esse motivo o formato tridimensional das proteínas é tão importante. Isso porque elas dependem de “encaixes” para funcionar.

Voltando ao básico, no entanto, as proteínas regulam a expressão genética, a produção de compostos essenciais, a digestão de alimentos e inúmeras outras funções. Para exemplificar, pense na proteína lactase. Ela é responsável por se ligar à lactose, presente em derivados do leite, e quebrar essa molécula. Quando uma pessoa não produz corretamente a enzima lactase, acontece a intolerância à lactose.

Inúmeras outras doenças são causadas por esse tipo de problema. Além do mais, outros distúrbios são relacionados a proteínas essenciais. Portanto, a tecnologia DeepMind pode ajudar a desenvolver novos tratamentos para centenas de doenças. Ademais, os pesquisadores testaram o algoritmo em uma das proteínas utilizadas pelo Sars-CoV-2. Os resultados foram, também, de mais de 90% de semelhança da previsão com a proteína original.

Um avanço histórico

Em torno de 1990 o projeto CASP (Critical Assessment of protein Structure Prediction) começou. Esse trabalho tinha como objetivo prever especificamente como uma proteína adquire o formato tridimensional que observamos. Até essa época, inclusive, acreditava-se que esse tipo de mapeamento poderia levar milênios até acontecer de forma eficiente.

Contudo, assim como muitas ciências, a biologia se ligou profundamente à informática. Análises estatísticas permitem que um inteligência artificial faça milhões ou até bilhões de simulações em curtos períodos de tempo. Isso acelerou muito o ritmo de descobertas científicas, não apenas na biologia, mas também na química, física e medicina.

Continuando o projeto CASP, a DeepMind rompeu uma barreira histórica. Isso porque todas as simulações feitas até então apresentavam níveis de similaridade muito mais baixos do que os resultados dessa inteligência artificial, em torno de 50%.

Compartilhar