Meta FAIR实验室提出的集合块解码技术通过融合传统下一词预测和遮蔽词预测,让语言模型能以任意顺序同时生成多个词汇,无需修改模型架构即可将推理速度提升3-5倍。该技术在Llama-3.1和Qwen-3模型上验证有效,为大型语言模型的实际应用提供了重要的效率突破,有望显著改善用户体验并降低部署成本。
H Company研究团队开发了开源网页操作AI系统Surfer-H,配备专门训练的Holo1视觉语言模型。该系统在WebVoyager基准测试中达到92.2%的成功率,媲美GPT-4性能但成本仅为其四分之一。研究团队还发布了专门的网页定位测试集WebClick,并完全开源模型权重,为AI技术民主化做出重要贡献。