FullFront是一项创新研究,首次全面评估多模态大语言模型在前端工程完整流程(从设计概念化到视觉理解再到代码实现)中的能力。研究通过精心设计的基准测试,包括网页设计、网页感知问答和网页代码生成三大核心任务,发现即使最先进的模型在精细视觉感知(如元素对齐、大小和间距)方面表现远低于人类专家,且在复杂布局和交互功能实现上仍存在显著局限。研究揭示了闭源模型普遍优于开源模型,但所有模型与人类专业水平间仍存在巨大差距,为未来AI辅助前端开发工具的改进提供了重要方向。
至顶网 科技行者 2025-05-29 10:24:54