IA para química

Quando os cientistas projetam novas moléculas para uma determinada aplicação, eles precisam sintetizá-las para verificar experimentalmente se possuem as propriedades corretas. Do contrário, os cientistas projetam novas moléculas (que podem ser análogas às moléculas previamente sintetizadas, por exemplo) e iteram até obter moléculas que satisfaçam seus requisitos (propriedades, desempenho, preço, toxicidade, impacto ambiental entre outras). Esse processo iterativo exige muito tempo e dinheiro.

Leia também

A I.A. – Inteligência Artificial na busca de antibióticos

Inteligência artificial procura novas drogas anticâncer

Um químico artificial para acelerar o P&D

Um “robô químico” inteligente e totalmente autônomo

Ser capaz de prever com precisão as propriedades de moléculas hipotéticas permitiria aos pesquisadores sintetizar apenas as mais promissoras e evitar a síntese e o teste de muitas moléculas que não possuem as propriedades desejadas. Os métodos tradicionais de predição das propriedades das moléculas têm sido usados há muito tempo, muitas vezes sob o nome de Relações Quantitativas Estrutura-Atividade (QSAR) ou Relações Quantitativas Estrutura-Propriedade (QSPR). Esses métodos são geralmente baseados em leis físicas ou relações empíricas relacionando a estrutura das moléculas (muitas vezes indiretamente, por meio de um conjunto de descritores escolhidos) às suas propriedades.

A predição de propriedades moleculares também pode ser feita usando algoritmos de aprendizado de máquina. Esses algoritmos têm sido usados para prever propriedades como bioatividade, toxicidade, solubilidade, pontos de fusão, energias de atomização, energias orbitais moleculares HOMO / LUMO e muitos outros tipos de propriedades. Não se baseiam em leis físicas nem em relações empíricas elaboradas manualmente: são inteiramente orientados por dados. Basicamente, esses algoritmos de IA são treinados alimentando-os com muitos exemplos de moléculas e suas propriedades associadas (aprendizado supervisionado).

Algoritmos baseados em IA são particularmente adequados para problemas para os quais as leis físicas que determinam as propriedades moleculares a serem previstas não são exatamente conhecidas, ou quando as relações empíricas seriam muito complicadas de estabelecer. Curiosamente, a IA pode ser usada em combinação com outros métodos de previsão, como equações físicas ou relações empíricas, a fim de obter previsões ainda mais precisas. Por exemplo, a IA pode usar os resultados de previsões feitas por relacionamentos físicos ou empíricos como dados de entrada.

Projetar novas moléculas é uma das tarefas de maior valor agregado que os químicos realizam. Eles, geralmente, usam seus conhecimentos de química, seu conhecimento de domínio e sua criatividade para propor novas estruturas moleculares que são testadas virtualmente ou experimentalmente nas aplicações relevantes. Existem duas limitações principais para este método. A primeira limitação é que a criatividade humana é inerentemente tendenciosa: um químico pode preferir certos grupos funcionais ou padrões moleculares (conscientemente ou não) e pode excluir moléculas que ele acha estranhas ou não gosta. A segunda limitação é que, quando um grande número de novas moléculas (centenas de milhares ou mesmo milhões) é necessário para a triagem virtual, a mente humana não é capaz de projetar conjuntos tão grandes de moléculas em um tempo razoável.

A IA é usada como um complemento valioso para a criatividade humana para projetar novas moléculas. É menos tendencioso do que a criatividade humana e pode gerar grande número de moléculas em tempos curtos. A IA necessidade de um aprendizado profundo que exige grande número de moléculas, normalmente milhões, para construir uma distribuição estatística das moléculas.

Felizmente, já existem vários conjuntos de dados contendo milhões de moléculas que estão disponíveis gratuitamente, por exemplo, banco de dados ZINC, QM9, ChEMBL etc. Além disso, ao usar este tipo de algoritmo, deve-se verificar se as moléculas geradas são efetivamente diferentes o que melhora identificar a diversidade química das moléculas.

Depois de passar por um processo de aprendizagem profundo a AI pode gerar grande número de novas moléculas por amostragem da distribuição estatística. Em seguida, as moléculas projetadas pela AI podem ser sintetizadas ou usadas para triagem virtual para prever suas propriedades e selecionar apenas as mais interessantes para desenvolvimento posterior. Alternativamente, se em vez de obter grande número de moléculas por AI, é mais vantajoso projetar pequeno número de moléculas com uma precisão alta.