Síntese das oportunidades identificadas para aplicação do workflow MC/DFT (DICE+Gaussian) em moléculas de interesse clínico com cobertura insuficiente na literatura, com referências e justificativas para a reunião com o orientador.
Existe uma tendência clara de ML potentials no campo, mas o nicho específico do seu método — efeitos locais de primeira camada de solvatação em moléculas biologicamente relevantes — permanece sem substituto confiável. O argumento não é "baixo custo computacional"; é precisão onde outros métodos falham.
Quatro candidatas identificadas por varredura da literatura. Ordenadas por prioridade considerando relevância clínica, tamanho da lacuna e facilidade de extensão a partir do trabalho publicado.
Principal fármaco do Parkinson há mais de 50 anos. O monitoramento de seus níveis em fluidos biológicos é problema analítico aberto. Possui grupo catecol idêntico à EP/NP mais um grupo carboxílico e amino — três sítios de ligação de hidrogênio com o solvente.
Estudos focam no estado sólido cristalino (DFT periódico) ou fase gasosa. O trabalho de Araújo et al. (2020) analisa propriedades do cristal. Um estudo de 2019 faz DFT com clusters de apenas 10 moléculas de água posicionadas manualmente — sem estatística MC.
O grupo catecol é o mesmo da EP/NP — os shifts esperados no catecol serão diretamente comparáveis. A novidade fica por conta do grupo α-amino ácido, que adiciona um zwitteríon em solução, tornando a comparação PCM vs. explícito ainda mais argumentável.
Hormônio com funções no ritmo circadiano, neuroproteção e atividade antioxidante. Alvo de pesquisa em Alzheimer, Parkinson e distúrbios do sono. Alta demanda por métodos analíticos em solução aquosa — os sítios de HB do grupo amida e da hidroxila do indol tornam o PCM particularmente inadequado.
O estudo de Engberg et al. (J. Phys. Chem. B, 2025) usa DM com ML para interações com membranas lipídicas. O estudo de solvatação em água de Guo et al. (2021) usa dinâmica molecular ab initio — sem análise vibracional estatística, sem comparação PCM vs. explícito, sem RDF/MDDF.
O grupo indol absorve fortemente no UV — UV-Vis via TD-DFT seria uma extensão natural e de alto impacto, com dados experimentais abundantes para comparação. CAM-B3LYP, que você já usa, é o funcional padrão para transições de carga longa distância presentes no indol.
Neurotransmissor com papel central em humor, sono, cognição e motricidade. Monitorado em diagnóstico de tumores neuroendócrinos (carcinoide). Estruturalmente semelhante à melatonina — os dois poderiam compor um único estudo comparativo.
O que existe é quase todo SERS em nanopartículas de prata (Manciu et al., 2017; Eremina et al., 2023) — não solvatação em água livre. DFT em fase gasosa e PCM implícito. Nenhum estudo com abordagem MC + shell estatística de solvatação.
GABA existe como zwitteríon em solução aquosa — o PCM é reconhecidamente inadequado para zwitteríons porque não capta a estabilização assimétrica das cargas. Isso torna o argumento pela solvatação explícita especialmente forte e direto.
Estudos com clusters de 8–10 moléculas de água posicionadas manualmente, sem amostragem estatística MC. A diferença metodológica é clara e argumentável.
UV-Vis computacional é feito pelo mesmo Gaussian com a keyword TD (Time-Dependent DFT). O workflow MC → shell → single point é idêntico ao do Raman — apenas a propriedade extraída muda.
Adicionar TD(NStates=20) na linha de rota calcula as 20 primeiras transições eletrônicas. O output entrega comprimentos de onda (nm), forças de oscilador e os orbitais HOMO→LUMO envolvidos. CAM-B3LYP é exatamente o funcional recomendado para UV-Vis — você já o usa.
Trabalho publicado no ChemRxiv (2024) mostra que águas explícitas em sítios de HB deslocam os comprimentos de onda em até 20 nm em relação ao PCM — diferença com impacto direto na comparação com dados experimentais. Mesmo argumento do seu artigo de Raman, aplicado ao UV-Vis.
%chk=mol_td.chk
%mem=8GB
%nprocshared=8
# TD(NStates=20) CAM-B3LYP
/6-311++G(d,p)
Single point TD-DFT
0 1
[coordenadas da shell MC]
Extração dos comprimentos de onda e forças de oscilador do .log, broadening Gaussiano para gerar o espectro UV-Vis simulado, comparação entre os três ambientes (in vacuo, PCM, explícito). cclib lê outputs TD-DFT da mesma forma que frequências vibracionais — o código do MVP 1 já cobre isso.
É importante entender o movimento de ML para posicionar o seu trabalho corretamente na conversa com o orientador — sem ignorar a tendência, sem superestimar o impacto de curto prazo.
Aprende a superfície de energia potencial a partir de dados ab initio, permitindo MD muito mais rápida. Substitui o campo de força clássico do MC — não o cálculo DFT das propriedades espectrais. A etapa quântica (Gaussian) permaneceria necessária de qualquer forma.
Treinar um ML potential para um sistema novo requer ~100.000 cálculos DFT de referência. Para moléculas nunca estudadas com esse método, o custo de entrada é proibitivo. MC clássico (DICE) continua sendo o caminho viável e publicável.
A arquitetura Python que estamos construindo pode incorporar ML potentials como motor de amostragem no futuro — substituindo o DICE como subprocess, mantendo tudo o mais igual. O investimento no pipeline não é perdido com a mudança de paradigma.
Seu nicho é "precisão local de primeira camada para moléculas biologicamente relevantes sem dados de ML disponíveis". Esse espaço é real, defensável e ainda produtivo por vários anos.
Referências consultadas neste mapeamento, organizadas por relevância para a proposta.