KAIST研究团队开发了CLEANMOL框架,解决了大语言模型理解SMILES分子表示法的关键难题。传统模型即使在简单任务如计数分子环数时也表现不佳,因为SMILES编码中结构信息常呈非连续分布。研究通过设计官能团匹配、环计数等确定性任务,大大提升了模型对分子结构的理解。实验表明,预训练后的模型在逆合成等下游任务上表现优异,精确匹配率从45.6%提升至58.1%。这一突破无需昂贵实验数据,为药物开发和材料设计提供了低成本高效的AI支持方案。
至顶网 科技行者 2025-05-30 15:07:48