Anthropic研究员使用新发布的Claude Opus 4.6模型构建C编译器,历时两周进行近2000次代码会话,最终产生10万行代码的编译器,能够在x86、ARM和RISC-V架构上编译Linux内核。该实验采用16个智能体并行工作,无需人工干预。虽然展示了自主开发复杂项目的可能性,但生成的代码效率不高,质量远低于专家水平,且存在安全隐患。GitHub用户对此实验持质疑态度。
OpenAI发布两款开源推理模型gpt-oss-120b和gpt-oss-20b,分别具有1170亿和210亿参数,可运行代码并与外部系统交互。其中20b版本仅需16GB显存,适合设备端部署。同时Anthropic推出Claude Opus 4.1升级版,在编程能力测试中得分提升至74.5%,并改进了研究和数据分析功能。