搜索准确率最高的计划软件【罔芷:——88pk·ee—

Writer 推出 Palmyra X5，以 75% 降低的成本提供接近 GPT-4.1 水平的表现

Writer 推出全新 LLM Palmyra X5，配备百万标记窗口，利用混合注意力和专家混合技术，在降低成本的同时实现接近 GPT-4.1 的性能，助力企业部署高效 AI 自动化。

至顶网 VentureBeat 2025-04-29 09:57:06

仅需单一数据即可超越强化学习：Ubiquant研究团队揭示的单样本熵最小化训练法突破

研究人员训练了13,440个大型语言模型，发现熵最小化方法仅需一个未标记数据和10步优化，就能实现比传统强化学习更好的性能提升。这种"单样本熵最小化"完全无监督，基于两个简单假设：语言模型生成过程本质上是随机的，且正确答案通常熵值更低。研究表明该方法能使模型logits分布向右偏移，增强置信度，对推理能力产生显著提升，平均提高24.7个百分点。这一发现或将重塑大型语言模型的后训练范式。

至顶网科技行者 2025-06-03 15:15:55

UniR：为冻结大语言模型设计的通用型、可组合、即插即用的推理器

UniR（Universal Reasoner）是一种创新的推理增强方法，可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发，该方法将推理能力分解为独立的轻量级模块，无需改变主模型结构。UniR的核心优势在于高效训练（仅更新小型推理模块）、出色的模型间迁移能力（小模型可指导大模型）以及模块组合能力（多个专用模块可通过logits相加组合使用）。在数学推理和翻译测试中，UniR显著超越现有微调方法，展示了轻量级模块如何有效增强大语言模型的推理能力。

至顶网科技行者 2025-06-02 19:21:14

首尔大学团队突破：让AI"压缩文档"变得更聪明，就像聪明的图书管理员一样快速找到关键信息

首尔大学研究团队开发出名为ECoRAG的智能文档压缩框架，解决了AI系统在处理长文档时效率低下和准确性不足的问题。该技术通过"证据性"概念区分有用信息与干扰内容，并具备自我反思能力来决定所需信息量。实验显示，新方法在保持更高准确率的同时，显著减少了处理时间和计算成本，为搜索引擎、在线教育、医疗诊断等领域带来广阔应用前景。

至顶网科技行者 2025-06-16 09:44:34

清华大学团队推出RLPR：AI无需"考官"也能自我提升，推理能力大幅跃升

清华大学团队开发出RLPR框架，让AI无需外部验证器就能自我评估推理质量。通过观察模型生成正确答案时的概率分布，AI学会了自我反思和改进。该方法在七个测试基准上显著提升了AI的推理能力，甚至超越了使用专门训练验证器的方法，为AI发展开辟了新道路。

至顶网科技行者 2025-06-26 12:52:28

微软最新突破：AI语音助手终于学会边思考边说话了！

微软研究团队开发了STITCH技术，让AI语音助手首次具备了边说话边思考的能力。该系统巧妙利用语音播放时间进行推理计算，在不增加响应延迟的情况下，将数学推理准确率提升近60%。这项突破模仿了人类自然的认知节奏，为AI交互体验带来质的飞跃，预示着更智能、更自然的人机对话时代即将到来。

至顶网科技行者 2025-07-24 16:27:05

百度推出全新AI计算架构结合飞桨优化计算能力

百度首席技术官王海峰正式发布百度大脑5.0，实现了历史上最具跨越性升级，在算法突破、计算架构升级的基础上，实现AI算法、计算架构和应用场景的融合创新，成为软硬一体AI大生产平台。

至顶网科技行者 2019-07-04 11:31:34

华盛顿大学首创耳机AI助手：悄悄在你耳边提醒的智能伙伴来了

华盛顿大学研究团队开发出世界首个主动式耳机AI助手LLAMAPIE，能够在用户对话中主动提供简短关键词提醒，无需用户主动询问。该系统采用双模型架构，在真人测试中将问答准确率从37%提升至87%，同时保持对话自然流畅。这项技术为人机交互带来新突破，在教育、商务和辅助医疗等领域具有广阔应用前景。

至顶网科技行者 2025-07-09 09:44:18

约翰霍普金斯大学揭秘：AI为什么总是对外部建议"充耳不闻"？

约翰霍普金斯大学研究团队发现，即使给AI模型提供近乎完美的外部反馈，它们仍然无法完全吸收并达到理论最佳表现，这种现象被称为"反馈摩擦"。研究通过九项不同任务测试了多个先进AI模型，发现所有模型都存在这一局限性，且主要原因是模型的反馈抗拒而非反馈质量问题，为AI自我改进研究指明了新方向。

至顶网科技行者 2025-06-19 16:59:50

武汉大学团队让AI学会"诊断"金融知识：像医生检查身体一样评估AI模型

武汉大学团队开发出FinCDM金融AI认知诊断框架，首次将教育心理学的认知诊断理论应用到金融AI评估中。该框架能像医生体检一样精确诊断AI模型在70个金融概念上的具体掌握情况，而非传统的粗糙总分评估。研究构建了基于CPA考试的高质量数据集，对30个AI模型的测试揭示了模型间的隐藏差异和现有评估的盲区，为金融AI的精准选择和针对性改进提供了重要工具。

至顶网科技行者 2025-09-09 10:37:25

能听能看的贴心AI伴侣来了，字节推出M3-Agent多模态智能体框架

至顶网至顶AI实验室 2025-08-14 16:46:30

上海交通大学团队打造AI罕见病诊断"神探"：95%准确率破解医学界百年难题

上海交通大学联合多家机构开发的DeepRare系统在罕见病诊断领域取得重大突破，通过多智能体架构整合症状、基因和文献数据，实现57.18%首选诊断准确率，对1013种疾病达100%准确率。系统提供透明推理过程，95.4%获专家认可，已部署为Web应用供临床使用。

至顶网科技行者 2025-07-01 09:54:45

通过数据虚拟化和容器化使数据库现代化，从而获得更高的 ROI

IBM Db2现在作为 IBM Cloud Pak for Data的扩展提供，提供了数据虚拟化的容器化体验，甚至比以前更灵活。

至顶网至顶网大数据频道 2020-11-11 15:34:48

世优科技纪智辉：AI加速数字人照进现实

生成式AI让数字人更更快“活起来”。

至顶网金旺 2024-07-30 09:58:33

奇安信领跑国内网络威胁检测与响应市场广泛覆盖重点行业政企组织

2021 年中国网络威胁检测与响应市场环境受到网络威胁、政策监管和企业刚性需求等三方面的驱动。

至顶网至顶网网络与安全频道 2022-07-11 12:00:02

原来AI也会内耗啊，新加坡国立大学提出Thinkless解决AI过度思考问题

2025年5月19日，新加坡国立大学研究团队发表最新研究Thinkless，就像是给"内耗"的AI朋友配了一个心理咨询师，教会它什么时候该深度思考，什么时候可以快速回答。

至顶网至顶网码客人生频道 2025-05-27 17:18:25

大语言模型能当期刊审稿人吗？耶鲁团队首创AI论文评审基准测试

耶鲁大学团队首创AI论文审稿基准测试系统LIMITGEN，通过人工植入缺陷和真实审稿数据两套测试集，系统评估大语言模型识别科学论文局限性的能力。结果显示AI审稿准确率约52%，远低于人类专家的86%，但检索增强技术和多智能体协作显著提升了性能，为AI辅助学术评议提供了新思路。

至顶网科技行者 2025-07-07 09:18:58

从看电视到AI眼中的世界：Meta和UC Berkeley如何让机器像人类一样"看"视频

Meta和UC Berkeley联合研究团队开发了名为Toto的AI模型，通过"看前猜后"的方式学习理解视频。该模型观看了超过十万小时视频内容，在图像分类、视频理解、物体跟踪和机器人操作等多个任务中表现出色，甚至自然涌现了"物体永恒性"理解能力。研究发现视觉AI也遵循类似语言模型的缩放定律，但效率略低于语言模型。这项工作为构建通用视觉AI系统提供了新思路。

至顶网科技行者 2025-09-16 10:30:57

戴尔科技集团是具有国际化IT支撑服务能力的基础构架提供商

埃森哲报告显示，通过人工智能和机器学习，建立起真正以客户为中心的供应链，可实现生产率、预测准确率分别增加33%和15%，而库存量则减少达30%。

至顶网戴尔 2021-10-21 14:58:42

MWC对话九州云：5G将创造工业应用的新场景

在MWC2019世界移动大会期间，“中国联通MEC边缘云商用加速计划发布会”在场内同步举行。数十家业内与联通达成战略合作，共同探讨MEC边缘云技术标准、平台架构、组网方案、落地实践等。

至顶网 MWC报道组 2019-02-28 13:57:41