搜索准确率最高的计划软件【罔芷:——88pk·ee—

“数据飞轮”强化AI智能体“内功心法” 加快开启生产力“相变”

当技术洪流裹挟着每一次发展的浪潮，“工作”、“生产力”乃至“生命”本身的价值都被加速定义。

至顶网毛烁 2025-04-24 17:28:07

南开大学团队采用全场景AI框架昇思MindSpore，打造“皮肤病大规模可信综合辅助诊断系统”

刘佳烜介绍说，他们计划继续深化与华为的全方位合作，与华为健康深度融合。“作为以‘爱国奋斗、公能日新’为价值追求的南开人，为国家和社会贡献新时代青年的力量！”

至顶网业界供稿 2022-12-23 08:38:53

推理模型更懂如何表达自信：大型语言模型如何通过慢思考实现更准确的自我评估

这项研究证明推理模型（使用链式思考的大语言模型）不仅在解决问题上表现优异，还能更准确地表达其确信度。研究人员在六个数据集上评估了六种推理模型，发现它们在33/36种测试设置中比非推理模型表现更好。深入分析揭示这一优势来源于"慢思考"行为，如探索替代方案和回溯，使模型能够在推理过程中动态调整确信度。有趣的是，非推理模型在通过少样本学习引导进行慢思考时也能获得类似改进，证明这一能力源于思考方式而非模型结构。

至顶网科技行者 2025-05-26 08:19:17

VidText：视频文本理解的全面评估新基准，打造视觉文本与上下文交互的研究新高度

VidText是一个全新的视频文本理解基准，解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容，提出三层评估框架（视频级、片段级、实例级），并配对感知与推理任务。对18个先进多模态模型的测试显示，即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分，远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响，为未来视频文本理解研究提供了方向。

至顶网科技行者 2025-06-03 18:36:09

用AI"慧眼"保护非洲野生动物：从传统CNN到视觉变换器的技术革命

这项由尼日利亚阿雷瓦数据科学学院主导的国际研究，通过对比DenseNet、ResNet、EfficientNet和Vision Transformer四种深度学习模型，为非洲野生动物保护提供了AI技术解决方案。研究发现DenseNet-201在实用性和准确率间达到最佳平衡，并成功部署了在线识别应用，为AI技术服务野生动物保护事业提供了完整的从理论到实践的范例。

至顶网科技行者 2025-08-05 13:21:09

打通实验室到现实生活的“最后一公里”，英特尔的独家软件策略

软件在当下的重要性不言而喻，而软件也是英特尔六大技术支柱之一，通过创建统一的软件架构，全面覆盖从云到端的计算，为全新的硬件架构带来指数级的性能提升，发掘更多的潜力。

至顶网李祥敬 2020-12-04 11:02:14

Amazon推出BYOKG-RAG：让智能问答系统能够自如运用任何知识图谱的突破性技术

Amazon研究团队开发的BYOKG-RAG技术通过多策略检索和迭代优化，解决了传统知识图谱问答系统难以适应不同图谱结构的问题。该技术将大语言模型与专业检索工具结合，在五个基准测试中平均提升4.5个百分点，特别适用于企业级应用。已开源发布。

至顶网科技行者 2025-07-22 13:23:16

扩散语言模型遇到量化压缩：香港城市大学团队首次系统研究扩散大语言模型的压缩之路

香港城市大学等机构联合开展的首个扩散大语言模型量化研究发现，这类新型AI模型存在特殊的激活异常值分布模式，为量化压缩带来新挑战。研究系统评估了多种量化方法，发现4位权重量化和8位权重激活同时量化是目前最实用的选择，GPTQ和DuQuant分别在两种策略中表现最佳，为扩散语言模型的实用化部署提供了技术指导。

至顶网科技行者 2025-09-09 10:36:32

帝国理工学院开发X-Node：图神经网络首次实现"自我解释"，让AI医疗诊断不再是黑匣子

帝国理工学院开发的X-Node框架首次实现图神经网络的自我解释功能，让AI系统中的每个节点都能像医生一样解释自己的诊断思路。该技术通过内置推理模块和自然语言生成，为医疗AI的"黑匣子"问题提供了革命性解决方案，在保持诊断准确性的同时大幅提升了系统的可信度和透明度。

至顶网科技行者 2025-08-19 12:37:49

无需"正确答案"也能训练数学问题求解：百川智能基于格式和长度的强化学习新方案

百川智能等机构的研究团队提出了一种创新方法，利用答案格式和长度作为替代信号，无需标准答案就能训练大型语言模型解决数学问题。研究发现，在训练初期15步内，仅基于格式正确性的奖励函数就能产生与标准GRPO算法相当的性能提升。随后引入长度奖励后，这种方法甚至在某些情况下超过了依赖标准答案的传统方法，使用7B基础模型在AIME2024上达到40.0%的准确率。研究揭示了一个关键洞察：基础模型就像已掌握数学和逻辑推理技能但考试表现不佳的优秀学生，只需培养良好的答题习惯即可充分释放其潜能。

至顶网科技行者 2025-05-30 10:04:26

MIT联手斯坦福打造"超级听力"AI：让机器像人耳一样理解声音的奥秘

MIT和斯坦福研究团队开发了AuriStream，一个模仿人类听觉系统的革命性语音AI。该系统采用两阶段设计：WavCoch组件将音频转换为类似耳蜗的频谱表示，autoregressive模型预测声音序列。AuriStream在词汇语义理解上创造新纪录，音素识别达88%准确率，并具备独特的可解释性——能将预测结果可视化为声谱图。这项发表于arXiv的研究为语音AI开辟了生物启发的新路径。

至顶网科技行者 2025-08-26 14:12:58

看Claude新算法如何巧妙解决AI训练中的"偏心"问题：Anthropic团队的REINFORCE++突破

Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件，用统一评价标准替代针对单个问题的局部基准，有效避免了"奖励破解"现象。实验显示，REINFORCE++在处理新问题时表现更稳定，特别是在长文本推理和工具集成场景中展现出优异的泛化能力，为开发更实用可靠的AI系统提供了新思路。

至顶网科技行者 2025-09-18 13:53:05

李开复零一万物发布大模型Yi-34B ，阿里云魔搭社区开源首发

零一万物创始人及 CEO 李开复博士表示:“零一万物坚定进军全球第一梯队目标，从招的第一个人，写的第一行代码，设计的第一个模型开始，就一直抱着成为‘World‘s No.1’的初衷和决心。”

至顶网阿里云 2023-11-06 15:12:25

蚂蚁集团推出UI-Venus：让AI也能像人一样"看懂"并操作电脑界面

蚂蚁集团推出UI-Venus系统，这是一个能够仅通过屏幕截图就理解和操作用户界面的AI模型。该系统采用强化微调技术，在多个基准测试中达到业界最佳水平，其72B版本在界面识别任务上准确率达95.3%，在复杂的安卓操作任务中成功率达65.9%。研究团队还开发了创新的自进化轨迹对齐技术，显著提升了AI在多步骤任务中的规划能力，为智能化人机交互开辟了新途径。

至顶网科技行者 2025-08-19 10:18:56

微软新突破：RetroInfer如何让AI模型处理百万级文本不再"卡顿"？

想象一下，有一座能容纳数百万册图书的巨大图书馆。当你需要查找特定信息时，必须浏览所有书籍才能找到所需内容。这正是现代AI大模型（如ChatGPT）处理长文本时面临的窘境。

至顶网科技行者 2025-05-08 10:24:49

智能听音诊断黑科技为服务器“闻风听诊” ——听音10秒就能精准预警，精准度达95%

浪潮信息最新发布的智能听音诊断技术，可以让服务器风扇的故障预警准确率达到95%，将这一会引发服务器故障和数据中心事故的安全隐患降到最低。

至顶网业界供稿 2023-06-08 17:21:20

研究推理的奖励模型：微软提出新方法让AI评判能力更上一层楼

微软研究院新提出的"奖励推理模型"(RRM)为大型语言模型开创了全新评估方式。传统奖励模型对所有问题使用统一计算资源，而RRM能像人类一样先进行推理思考再做判断，对复杂问题投入更多思考资源。研究团队通过强化学习框架训练模型自主发展推理能力，无需显式示例。实验证明RRM在多个基准测试上表现优异，能自适应扩展计算资源提升判断准确性。该研究为AI评估系统带来范式转变，使人工智能判断更接近人类思考过程。

至顶网科技行者 2025-05-26 08:09:01

阿里云团队突破传统：金融AI如何学会像专家一样思考

阿里云团队开发了Fin-PRM，一个专门针对金融推理的AI评判系统。该系统采用双重评判机制，既检查推理步骤准确性又评估整体合理性，并具备专业知识验证功能。通过3000个高质量样本训练，在三大应用场景中显示出显著性能提升：数据筛选提升12.9%，测试选择提升5.1%，强化学习提升5.2%，为金融AI的专业化发展提供了重要技术支撑。

至顶网科技行者 2025-08-28 14:52:43

IBM公布最新量子处理器，一跃升级为127量子比特

IBM公司日前推出了其最新、也是最复杂的一代量子处理器。通过对早期芯片做出多项重要架构改进，新版本达成了一项重大成果——成功升级至127量子比特。

至顶网业界供稿 2021-11-17 11:06:35

清华大学团队用AI"魔法师"重建3D世界：仅凭两张照片就能还原完整空间场景

清华大学团队开发出LangScene-X系统，仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图，配合语言量化压缩器实现高效特征处理，最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%，为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。

至顶网科技行者 2025-07-04 17:45:27