搜索准确率最高的计划软件【罔芷:——88pk·ee—

华为研究团队首创3D空间理解基准测试：让AI像人类一样理解多视角世界

华为科技团队开发出首个多视角3D空间理解基准测试Ego3D-Bench，包含8600个测试样本，覆盖距离测量、定位、运动推理等任务。同时推出Ego3D-VLM解决方案，通过构建文字版认知地图显著提升AI空间理解能力，多选题准确率提升12%，距离估算误差减少56%，为自动驾驶和机器人应用提供关键技术支撑。

至顶网科技行者 2025-09-25 14:40:22

VisTA：一种会学习选择视觉工具的人工智能，仿佛给视觉AI配了个聪明助手

VisTA是一种新型强化学习框架，使视觉AI能够自主探索、选择和组合多种视觉工具。与传统方法不同，VisTA无需人工监督，通过反复尝试学习哪些工具最有效。研究团队在ChartQA、Geometry3K等测试中证明，VisTA显著优于训练免费基线，特别是在分布外样本上表现更佳。其核心创新在于使用群体相对策略优化算法，让AI代理能够根据实际性能而非预设规则来选择工具，为未来发展更灵活的视觉推理系统铺平了道路。

至顶网科技行者 2025-05-30 16:21:57

OpenAI 新推理 AI 模型幻觉问题更严重

OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色，但幻觉率却远高于以往模型，引发了对准确性的严重担忧，亟待进一步研究。

至顶网 Techcrunch 2025-04-21 17:11:40

UNC Chapel Hill让AI变身万能专家：一个模型解决所有视觉推理难题

北卡罗来纳大学教堂山分校研究团队提出MEXA框架，通过动态选择和聚合多个专业AI模型来处理复杂的多模态推理任务。该方法无需额外训练，在视频理解、音频分析、3D场景理解和医学诊断等多个基准测试中显著超越现有模型，为AI系统设计提供了新思路。

至顶网科技行者 2025-06-25 14:54:23

技术界的新突破：以色列理工学院研究团队让AI模型学会"思维延续"的神奇技能

以色列理工学院研究团队开发出一种新颖的AI推理改进方法，通过训练专用的"继续思考"标记，让AI模型在解题时能够进行更深入的思考。该方法只需训练单个标记的嵌入向量，保持模型其他参数不变，在数学推理任务中展现出显著效果，准确率提升幅度达到传统方法的三倍以上，为AI推理能力提升提供了高效且通用的解决方案。

至顶网科技行者 2025-06-19 12:54:40

解决视觉语言模型的"眼见为实"难题：布朗大学团队开发像素与先验知识控制技术

这项研究创建了"Visual CounterFact"数据集，通过展示与常识相悖的图像（如蓝色草莓）测试视觉语言模型如何平衡视觉输入与记忆知识。研究发现，模型往往会被视觉输入左右，即使被问及通用知识问题。团队开发了"像素与先验"转向技术，成功控制模型在两种信息源之间的依赖，颜色任务成功率高达92.5%，大小任务达74.6%，为构建更可靠的多模态AI系统提供了新工具。

至顶网科技行者 2025-06-06 14:14:03

大脑剖析：揭秘大语言模型的思维策略、预测与控制的全新方法——KAIST与卡内基梅隆大学研究团队发现

这篇博文深入解析了KAIST与卡内基梅隆大学研究团队开发的COT ENCYCLOPEDIA框架，该框架能够自下而上地分析、预测和控制大语言模型的推理策略。研究显示，不同的推理策略对模型表现有显著影响，且这些策略主要由训练数据的格式而非内容领域塑造。通过引导模型采用最优策略，可提升模型准确率2.5%-8.3%，为AI系统优化提供了全新方向。

至顶网科技行者 2025-05-19 14:58:37

解锁电影的秘密：摄像机运动如何塑造你看到的每一帧画面

想象一下，当你走在一条陌生的街道上，你会不自觉地移动你的头部和眼睛来感知周围的环境。你可能会抬头看看高楼，左右张望观察街道两侧的店铺，或者转身看看身后是否有车辆驶来。这种自然的观察方式实际上非常类似于电影中摄像机的运动方式。

至顶网科技行者 2025-04-29 12:18:29

让AI真正"看懂"并编辑图片：上海交大团队开创视觉推理新基准

上海交大团队首次建立AI视觉推理评估标准RISEBench，测试发现即使最先进的GPT-4o-Image在推理驱动的图像编辑任务中准确率仅28.8%。研究涵盖时间、因果、空间、逻辑四大推理维度，揭示当前AI缺乏真正理解物理规律和逻辑关系的能力，为AI发展指明了从模式识别向深层推理转变的重要方向。

至顶网科技行者 2025-07-16 09:17:45

华南理工大学研究团队打造史上最大中文字符识别数据集，9万多个汉字让机器"慧眼识字"

华南理工大学研究团队构建了迄今最大的中文字符识别数据集MegaHan97K，包含97,455个汉字类别和超过460万个样本，是此前最大数据集的六倍。该数据集首次完全支持最新的GB18030-2022中文标准，通过手写、历史文献和合成三个子集有效解决了长尾分布问题。实验表明，使用该数据集训练的模型性能显著提升，为古籍数字化保护和现代中文处理应用提供了强大技术支撑。

至顶网科技行者 2025-06-12 09:54:33

小个子AI也能打败巨无霸？上海AI实验室发现"考试时间换智商"的神奇现象

上海AI实验室联合清华等机构发现，通过"测试时计算扩展"策略，小型AI模型可以战胜参数规模大135倍的巨型模型。10亿参数的模型在数学推理任务上超越了4050亿参数的模型，甚至5亿参数的迷你模型都能胜过GPT-4o。研究揭示了AI发展新方向：聪明的推理策略比模型规模更重要，为资源有限的机构提供了"以智取胜"的可能性。

至顶网科技行者 2025-08-26 12:01:14

KAIST研究团队突破AI训练瓶颈：让大语言模型从"废料"中学会更聪明推理

KAIST研究团队开发出RL-ZVP方法，首次让AI从训练中的"无用数据"学习。传统方法遇到全对或全错答案时会停止学习，但RL-ZVP通过分析词汇重要性给予精确反馈。在数学推理测试中，该方法比现有技术提升高达8.6个准确率点，且训练过程更稳定。这项突破重新定义了AI训练范式，证明了被忽视的训练数据实际蕴含巨大学习潜力。

至顶网科技行者 2025-10-17 11:10:05

让大型AI模型减肥变身，马普所等机构打造"瘦身"版训练新方法

德国马普所等机构提出OFTv2，一种更高效的AI模型训练方法。通过将计算从"权重中心"转为"输入中心"，结合Cayley-Neumann参数化技术，实现了10倍训练加速和3倍内存节省。该方法还扩展到量化模型训练，创造了QOFT框架，在数学推理等任务上超越了流行的QLoRA方法，为大型AI模型的高效训练提供了新方案。

至顶网科技行者 2025-06-30 10:51:29

联想全球IT组织利用UiPath自动化技术加快HR数字化转型步伐

企业自动化软件公司UiPath（纽交所代码：PATH）日前宣布，联想集团通过在全球范围内部署UiPath自动化技术，实现了生产力和效率的大幅提升。

至顶网业界供稿 2022-10-18 13:43:07

Skywork OR1: 昆仑团队打造的增强推理能力开源大模型

Skywork OR1是昆仑公司AI团队开发的开源推理大模型，通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列，采用名为MAGIC的训练方法，在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升，32B模型平均准确率提高15.0%，7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象，提出了有效的缓解策略，并开源了全部代码、数据和模型权重，为AI社区提供了宝贵资源。

至顶网科技行者 2025-06-02 16:33:24

新华三百业灵犀达国内先进水平！率先完成中国信通院大模型标准符合性验证

近日，紫光股份旗下新华三集团打造的私域大模型百业灵犀（LinSeer）在中国信通院组织的大规模预训练模型标准符合性验证中，模型开发模块被评为4+，达到国内先进水平。

至顶网业界供稿 2023-09-21 17:51:21

AI如何让屏幕上的文字变得栩栩如生：南京大学团队的神奇文字生成器

南京大学团队开发的TextCrafter系统成功解决了AI图像生成中多文字准确渲染的技术难题。该系统采用三阶段策略：实例融合、区域隔离和文字聚焦，实现了73.7%的文字准确率，相比基础模型提升45%以上。同时创建了包含2000个复杂场景的CVTG-2K评测数据集，为该领域建立了新标准。作为无需训练的即插即用技术，TextCrafter在广告设计、内容创作等领域具有广阔应用前景。

至顶网科技行者 2025-07-17 09:23:47

RM-R1：让AI评估变得更明智——将奖励模型转变为推理工具

想象一下，你正在参加一场料理比赛，有两位评委。第一位评委只给你一个分数，而第二位评委会详细解释你的菜品在口感、创意和技巧上的表现如何，然后才给出最终评价。显然，第二位评委的反馈对于你改进厨艺更有帮助。伊利诺伊大学研究团队正是秉持这一理念，开发了能像第二位评委那样工作的AI评估系统。

至顶网科技行者 2025-05-07 10:27:38

港中文团队发布WebGen-Bench：让AI从零写网站，但最强模型正确率仅27.8%

港中文团队发布首个AI网站生成能力基准测试WebGen-Bench，评估结果显示即使最强模型准确率仅27.8%，但通过专门训练的WebGen-LM-32B模型达到38.2%，为AI建站技术发展提供重要参考。

至顶网科技行者 2025-07-08 09:45:12

AI人脸识别技术前景光明

我们生活在一个AI能力有望超越人类大脑的时代下。

至顶网科技行者 2019-04-08 18:44:26