Mapeamento de oportunidades · 2025

O que propor como pesquisa —
moléculas, lacunas e estratégia

Síntese das oportunidades identificadas para aplicação do workflow MC/DFT (DICE+Gaussian) em moléculas de interesse clínico com cobertura insuficiente na literatura, com referências e justificativas para a reunião com o orientador.

Método base: MC sequencial + DFT / DICE + Gaussian Referência validada: Pinheiro & Costa, J. Mol. Struct. 2024 Compilado em: Maio 2025

Por que MC/DFT explícito ainda é relevante

Existe uma tendência clara de ML potentials no campo, mas o nicho específico do seu método — efeitos locais de primeira camada de solvatação em moléculas biologicamente relevantes — permanece sem substituto confiável. O argumento não é "baixo custo computacional"; é precisão onde outros métodos falham.

🎯
PCM subestima interações locais
Para moléculas com múltiplos sítios de HB (catecolaminas, indóis, aminoácidos), solvente implícito dá uma imagem incompleta dos shifts vibracionais — confirmado pela literatura recente de 2025.
ML ainda não tem dados suficientes
Treinar um ML potential para um novo sistema requer centenas de milhares de cálculos DFT de referência. Para moléculas novas, MC/DFT continua sendo o caminho viável.
📐
Lacuna específica documentada
Nenhuma das moléculas candidatas abaixo tem cobertura pelo método MC + DFT com shell estatística de solvatação — o que é exatamente o que o grupo já sabe fazer.

Moléculas com lacuna real na literatura

Quatro candidatas identificadas por varredura da literatura. Ordenadas por prioridade considerando relevância clínica, tamanho da lacuna e facilidade de extensão a partir do trabalho publicado.

L-DOPA (Levodopa)
L-3,4-dihidroxifenilalanina · Parkinson · fármaco de primeira linha
★ Prioridade 1 Lacuna alta Catecol + aminoácido Raman · UV-Vis
Por que é relevante

Principal fármaco do Parkinson há mais de 50 anos. O monitoramento de seus níveis em fluidos biológicos é problema analítico aberto. Possui grupo catecol idêntico à EP/NP mais um grupo carboxílico e amino — três sítios de ligação de hidrogênio com o solvente.

O que existe na literatura

Estudos focam no estado sólido cristalino (DFT periódico) ou fase gasosa. O trabalho de Araújo et al. (2020) analisa propriedades do cristal. Um estudo de 2019 faz DFT com clusters de apenas 10 moléculas de água posicionadas manualmente — sem estatística MC.

Lacuna exata: Nenhum trabalho aplica simulação Monte Carlo + DFT para obter a shell de solvatação estatística da L-DOPA em água e calcular shifts Raman por ligação de hidrogênio — a metodologia que você já tem validada para EP/NP.
Extensão natural

O grupo catecol é o mesmo da EP/NP — os shifts esperados no catecol serão diretamente comparáveis. A novidade fica por conta do grupo α-amino ácido, que adiciona um zwitteríon em solução, tornando a comparação PCM vs. explícito ainda mais argumentável.

Melatonina
N-acetil-5-metoxitriptamina · hormônio do sono · neuroprotetor
★ Prioridade 1 Lacuna alta Grupo indol + amida Raman · UV-Vis
Por que é relevante

Hormônio com funções no ritmo circadiano, neuroproteção e atividade antioxidante. Alvo de pesquisa em Alzheimer, Parkinson e distúrbios do sono. Alta demanda por métodos analíticos em solução aquosa — os sítios de HB do grupo amida e da hidroxila do indol tornam o PCM particularmente inadequado.

O que existe na literatura

O estudo de Engberg et al. (J. Phys. Chem. B, 2025) usa DM com ML para interações com membranas lipídicas. O estudo de solvatação em água de Guo et al. (2021) usa dinâmica molecular ab initio — sem análise vibracional estatística, sem comparação PCM vs. explícito, sem RDF/MDDF.

Lacuna exata: Inexistência de estudo com shell de solvatação estatística (MC) + Raman/UV-Vis por DFT em água para melatonina. O grupo indol tem características eletrônicas que tornam a comparação CAM-B3LYP vs. B3LYP especialmente interessante para UV-Vis.
Diferencial adicional

O grupo indol absorve fortemente no UV — UV-Vis via TD-DFT seria uma extensão natural e de alto impacto, com dados experimentais abundantes para comparação. CAM-B3LYP, que você já usa, é o funcional padrão para transições de carga longa distância presentes no indol.

Serotonina
5-hidroxitriptamina (5-HT) · humor · Parkinson · depressão
Prioridade 2 Lacuna moderada Indol + amina Raman · UV-Vis
Por que é relevante

Neurotransmissor com papel central em humor, sono, cognição e motricidade. Monitorado em diagnóstico de tumores neuroendócrinos (carcinoide). Estruturalmente semelhante à melatonina — os dois poderiam compor um único estudo comparativo.

O que existe na literatura

O que existe é quase todo SERS em nanopartículas de prata (Manciu et al., 2017; Eremina et al., 2023) — não solvatação em água livre. DFT em fase gasosa e PCM implícito. Nenhum estudo com abordagem MC + shell estatística de solvatação.

Estratégia sugerida: Estudar serotonina e melatonina no mesmo trabalho — ambas têm grupo indol, a comparação é cientificamente rica e o esforço computacional é dividido. Seria o primeiro estudo sistemático MC/DFT desse par em água.
GABA
Ácido γ-aminobutírico · principal inibidor do SNC
Prioridade 3 Zwitteríon em água Caso PCM vs. explícito
Por que é interessante

GABA existe como zwitteríon em solução aquosa — o PCM é reconhecidamente inadequado para zwitteríons porque não capta a estabilização assimétrica das cargas. Isso torna o argumento pela solvatação explícita especialmente forte e direto.

O que existe na literatura

Estudos com clusters de 8–10 moléculas de água posicionadas manualmente, sem amostragem estatística MC. A diferença metodológica é clara e argumentável.

Argumento forte: GABA é o caso mais didático para mostrar por que PCM falha — o zwitteríon tem carga separada estabilizada por HB assimétrico, algo que solvente contínuo não descreve. Um artigo focado nessa comparação metodológica teria apelo além da espectroscopia.

UV-Vis via TD-DFT — extensão natural pelo mesmo Gaussian

UV-Vis computacional é feito pelo mesmo Gaussian com a keyword TD (Time-Dependent DFT). O workflow MC → shell → single point é idêntico ao do Raman — apenas a propriedade extraída muda.

Como funciona no Gaussian

Adicionar TD(NStates=20) na linha de rota calcula as 20 primeiras transições eletrônicas. O output entrega comprimentos de onda (nm), forças de oscilador e os orbitais HOMO→LUMO envolvidos. CAM-B3LYP é exatamente o funcional recomendado para UV-Vis — você já o usa.

Por que a solvatação explícita importa

Trabalho publicado no ChemRxiv (2024) mostra que águas explícitas em sítios de HB deslocam os comprimentos de onda em até 20 nm em relação ao PCM — diferença com impacto direto na comparação com dados experimentais. Mesmo argumento do seu artigo de Raman, aplicado ao UV-Vis.

Input exemplo

%chk=mol_td.chk
%mem=8GB
%nprocshared=8

# TD(NStates=20) CAM-B3LYP
/6-311++G(d,p)

Single point TD-DFT

0 1
[coordenadas da shell MC]

O que o pipeline automatizaria

Extração dos comprimentos de onda e forças de oscilador do .log, broadening Gaussiano para gerar o espectro UV-Vis simulado, comparação entre os três ambientes (in vacuo, PCM, explícito). cclib lê outputs TD-DFT da mesma forma que frequências vibracionais — o código do MVP 1 já cobre isso.


ML Potentials — horizonte, não ameaça imediata

É importante entender o movimento de ML para posicionar o seu trabalho corretamente na conversa com o orientador — sem ignorar a tendência, sem superestimar o impacto de curto prazo.

O que ML faz aqui

Aprende a superfície de energia potencial a partir de dados ab initio, permitindo MD muito mais rápida. Substitui o campo de força clássico do MC — não o cálculo DFT das propriedades espectrais. A etapa quântica (Gaussian) permaneceria necessária de qualquer forma.

Por que não é imediato para você

Treinar um ML potential para um sistema novo requer ~100.000 cálculos DFT de referência. Para moléculas nunca estudadas com esse método, o custo de entrada é proibitivo. MC clássico (DICE) continua sendo o caminho viável e publicável.

Onde o pipeline se encaixa

A arquitetura Python que estamos construindo pode incorporar ML potentials como motor de amostragem no futuro — substituindo o DICE como subprocess, mantendo tudo o mais igual. O investimento no pipeline não é perdido com a mudança de paradigma.

Argumento para o orientador

Seu nicho é "precisão local de primeira camada para moléculas biologicamente relevantes sem dados de ML disponíveis". Esse espaço é real, defensável e ainda produtivo por vários anos.


O que levar para a reunião

Proposta mais forte
L-DOPA ou melatonina com MC/DFT + análise Raman de shifts por HB. Extensão direta do artigo publicado, lacuna documentada, relevância clínica alta.
+1
Extensão de alto impacto
UV-Vis via TD-DFT no mesmo workflow MC. Mesmo Gaussian, mesmos métodos. Dois produtos espectrais (Raman + UV-Vis) de uma só simulação.
Dois artigos por pesquisa
Artigo científico com os resultados espectrais + artigo de software descrevendo o pipeline automatizado. Estratégia de maximizar retorno de cada estudo.

Literatura de suporte com links

Referências consultadas neste mapeamento, organizadas por relevância para a proposta.