搜索准确率最高的计划软件【罔芷:——88pk·ee—

清华大学推出MATE系统：让AI成为残障人士的"万能翻译官"

清华大学研究团队开发了MATE多智能体翻译系统，这是首个专为残障人士设计的开源AI辅助工具。该系统能在文字、语音、图像间智能转换，如将图片转为语音描述、语音转文字等。系统包含8个专业智能体协作，准确率达91.7%，支持本地运行保护隐私，为视听障碍等用户群体提供了强大的信息获取工具。

至顶网科技行者 2025-06-30 10:54:10

吕建成：人工智能大模型时代的机遇与理论挑战

近日，在2022昇腾AI开发者创享日·成都站上，四川大学计算机学院院长吕建成进行了主题为《人工智能大模型时代的机遇与理论挑战》的精彩演讲。

至顶网业界供稿 2022-06-27 10:18:55

全国政协委员吴晶：”城市大脑”、”最多跑一次”应在全国推广

全国政协委员、浙江省省政协副主席吴晶在两会提案中呼吁加强社会治理智能化水平。

至顶网阿里巴巴 2018-03-06 12:24:29

NOVER是一种创新的无验证器强化学习框架，解决了传统激励训练依赖外部验证器的限制。由伦敦国王学院研究团队开发，它通过计算"推理困惑度"作为奖励代理，使语言模型能在任何文本任务中自主发展推理能力。实验表明，NOVER在一般推理、创意写作、社会智能和多语言能力等多种任务上均优于基线方法，甚至使3B模型接近从671B模型蒸馏版本的性能。此外，其灵活性还支持"反向激励训练"等创新应用，为语言模型训练开辟了新方向。

至顶网科技行者 2025-05-29 08:25:24

土耳其萨班哲大学突破性研究：AI学会用"天灾百科全书"识别全球灾后损失

土耳其萨班哲大学研究团队开发了突破性AI系统TCSSM，能够结合卫星图像和地理灾害描述，自动评估全球各地的自然灾害损失。该系统通过分析216万个问答样本，在跨地域测试中达到87.68%的平均准确率，为国际救援提供快速精准的损失评估工具。

至顶网科技行者 2025-08-15 15:05:52

ARM：自适应推理模型如何解决大型推理模型的"过度思考"问题

自适应推理模型(ARM)解决了大型推理模型的"过度思考"问题，能够根据任务难度自动选择合适的推理格式。研究团队通过创新的Ada-GRPO算法训练，使ARM在保持性能的同时平均减少30%的计算量，并提供自适应、指令引导和共识引导三种工作模式。这一突破使AI更接近人类思维方式，在简单问题上直接作答，复杂问题上才详细推理，极大提升了计算效率。

至顶网科技行者 2025-05-30 07:45:05

巧用梯度分组：西湖大学团队打造更高效的大语言模型训练方式

西湖大学团队提出的梯度分组缩放（SGG）方法巧妙解决了大语言模型训练中的关键挑战。与传统方法不同，SGG动态聚类每层参数并应用特定缩放因子，既保留参数级优化又引入组级约束。实验证明，SGG在多种任务和模型规模上显著提升性能，特别是使低秩训练首次达到全秩性能水平，且具有出色的稳定性和灵活性，为资源受限环境下的大模型训练提供了实用解决方案。

至顶网科技行者 2025-06-05 15:19:15

西安交通大学团队提出MAPS：基于性格理论的多智能体系统，让AI像人类专家团队一样协作解决科学难题

西安交通大学团队提出MAPS多智能体系统，基于心理学大七人格理论设计7个专门化AI智能体协作解决多模态科学问题。系统采用苏格拉底式质疑方法进行自我监督，在数学、物理、化学问题求解上比现有最佳AI提升15.84%，甚至超越人类专家3.58%，为AI协作系统设计提供了新思路。

至顶网科技行者 2025-08-01 10:14:31

腾讯觅影获中国人工智能大赛“创新之星”奖破解医疗AI普及难点

2020中国人工智能高峰论坛暨中国人工智能大赛发布会在厦门举行，“腾讯觅影”医疗影像人工智能解决方案荣获大赛“创新之星”奖。

至顶网至顶网人工智能频道 2020-12-24 15:01:06

浙江大学团队揭秘AI写作新现象：中间过程竟比最终答案更准确

浙江大学研究团队发现AI写作中的"时间振荡"现象：AI在生成过程的中间步骤往往给出正确答案，但最终输出时却被错误答案覆盖。团队提出"时间自一致性投票"和"时间一致性强化"两种解决方案，通过利用中间过程信息显著提升AI性能，在多个数学推理任务上实现2-25%的准确率提升，为AI系统的可靠性改进提供了新思路。

至顶网科技行者 2025-08-14 12:48:15

推理增强的大模型更容易产生幻觉吗？清华和新加坡国立大学团队深度解析

这项研究由清华大学和新加坡国立大学团队完成，系统探讨了大推理模型在事实查询任务中的幻觉问题。研究发现，仅通过单一训练阶段（仅SFT或仅RL）开发的推理模型更容易产生幻觉，而完整SFT+RL流程训练的模型幻觉较少。研究者识别出两种导致幻觉的关键认知行为："错误重复"和"思考-答案不匹配"，并从模型不确定性校准角度揭示了幻觉产生的内在机制，为开发更可靠的推理模型提供了重要指导。

至顶网科技行者 2025-06-03 13:33:56

国内AI自动化测试平台前三盘点：Testin XAgent、爱测、优测

传统测试模式普遍存在三大痛点：高度依赖人工操作、维护成本居高不下以及技术要求门槛较高。这些因素仍在制约着大多数企业的测试效率提升。随着AI测试技术的不断发展，软件质量保障体系正在重构。

至顶网至顶网软件与服务频道 2025-09-26 16:55:14

英特尔发布零售门店数字化赋能专项报告，引领行业智能化升级

英特尔亮相第二十四届中国零售业博览会（China Shop 2024）。会上，英特尔发布了《零售门店数字化赋能专项报告（2024年）》。

至顶网业界供稿 2024-03-14 09:10:53

人工智能的自学奇迹：清华大学研究团队开创"无师自通"的AI学习新方法

想象一下这个场景：一位学生拿到了一套没有标准答案的数学题。正常情况下，没有答案怎么知道自己做得对不对呢？大多数学生会卡在这一步。但如果这位学生非常聪明，他会想出一个办法——先用不同的解题思路做几遍，然后看哪个答案出现的次数最多，那个答案很可能就是正确的。接着，他会思考为什么其他方法得到了不同的答案，从而改进自己的解题技巧。这就是清华大学研究团队开发的"测试时强化学习"（TTRL）的核心思想。

至顶网科技行者 2025-04-24 14:24:43

视觉语言模型能看懂色彩世界吗？马里兰大学推出全面评估色彩理解能力的COLORBENCH基准测试

你是否曾经因为衣服色彩搭配不协调而尴尬？或者在医学诊断试纸上辨别微妙的颜色变化时感到困惑？色彩在我们的日常生活中扮演着至关重要的角色，从科学发现到医疗保健，从购物到艺术欣赏，无处不在。而人工智能，特别是视觉语言模型(VLMs)，正在迅速融入我们的生活，但它们真的能像人类一样理解和利用色彩信息吗？

至顶网科技行者 2025-04-18 16:53:57

华为云潘捷：九类关键能力、六大解决方案，华为云助力车企数字化转型

2021年12月19日，在北京 · 北苑大酒店举办的“2021中关村数字经济产业联盟会员代表大会暨华为云北京城市峰会”的领跑汽车智能时代高峰论坛上，华为云中国区副总裁，云原生企业业务部部长潘捷发表演讲。

至顶网业界供稿 2021-12-20 17:25:01

启动前先热身：如何在资源受限环境下激发AI大模型的通用推理能力

纽约大学阿布扎比分校研究团队提出了一种创新的两阶段训练方法，解决了AI领域的数据稀缺问题。他们首先让AI模型在简单的"骑士与恶棍"逻辑游戏中"热身"，学习通用推理技能，然后再用少量特定领域数据进行强化学习。实验表明，这种方法不仅大幅提升了模型在数学、编程和多学科理解任务上的表现，还显著提高了样本效率，使用仅100个样本就能达到传统方法需要数千样本才能实现的效果。更重要的是，"热身"过的模型在适应特定领域后仍能保持跨领域的泛化能力，为资源受限环境下开发强大AI系统提供了实用策略。

至顶网科技行者 2025-05-26 17:01:41

素描几笔就能找到关键点：加利福尼亚大学和萨里大学团队的跨模态AI识别突破

加利福尼亚大学和萨里大学研究团队开发了一种创新的AI系统，能够仅通过简单的手绘素描就在复杂照片中精确识别关键点。这项技术突破了传统机器学习需要大量同类数据的限制，实现了真正的跨模态学习。系统在动物关键点识别任务中达到了39%的准确率，超越现有方法约5个百分点，并且在真实手绘素描测试中表现稳定。该技术有望在生物学研究、医疗诊断、工业检测等多个领域找到广泛应用。

至顶网科技行者 2025-07-21 14:37:54

VisuLogic：一个评估多模态大语言模型视觉推理能力的基准测试

想象一下，你正在参加一场智力测试。主考官给你看了一张图片，并要求你找出图案的规律，预测下一个图形会是什么样子。对我们人类来说，这种视觉推理任务虽然有难度，但通常还算可行——我们能够观察图案变化、识别规律，然后做出合理推测。

至顶网科技行者 2025-04-25 14:17:31

ByteDance团队开发出首个多模态网页浏览AI测试基准：MM-BrowseComp，能看懂图像和视频的智能助手评估标准终于来了

ByteDance等机构联合发布的MM-BrowseComp是首个专门评估AI多模态网页浏览能力的测试基准。该研究包含224道需要综合处理文字、图像、视频信息的题目，测试结果显示即使是最先进的OpenAI o3模型也只达到29%的准确率，揭示了当前AI在多模态信息理解方面的技术短板，为未来AI发展指明了重要方向。

至顶网科技行者 2025-09-09 10:55:38