搜索准确率最高的计划软件【罔芷:——88pk·ee—

香港中文大学突破性成果：让相机像人眼一样精准"测距"，AI终于学会了准确判断物体远近

香港中文大学团队开发的TR2M系统突破性地解决了计算机视觉中的距离测量难题，通过结合图像和文字信息，让AI既能在各种环境中通用工作，又能给出精确的距离数字。该技术参数量小、效果好，在室内外及医疗场景测试中均表现优异，为自动驾驶、机器人导航、增强现实等应用提供了重要技术支撑，代表了多模态AI融合的重要进展。

至顶网科技行者 2025-06-23 11:46:03

Meta AI首次破解自回归图像生成的数字水印技术——像给AI生成的图片打上隐形身份证

Meta FAIR等机构首次成功将语言模型水印技术应用于自回归图像生成，解决了图像水印领域的关键技术难题——反向循环一致性缺失。通过专门的模型微调和水印同步层，实现了对AI生成图片的可靠来源追踪，准确率接近100%，且不影响图片质量。该技术在多个主流图像生成模型上验证有效，为AI内容监管提供了重要技术支撑。

至顶网科技行者 2025-06-26 09:40:07

华为周跃峰：数据觉醒时代，共创数据存储产业新未来

3月14日至15日，以“因聚而生数智有为”为主题的“华为中国合作伙伴大会2024” 在深圳隆重举行。华为数据存储产品线总裁周跃峰发表“数据觉醒时代，共创数据存储产业新未来”主题演讲。

至顶网至顶网存储频道 2024-03-18 11:16:51

澳鹏Appen（中国）精彩亮相2024世界人工智能大会（WAIC2024）

高质量的训练数据始终是人工智能产业链上的重要一环。自2019年始，澳鹏Appen（中国）已连续6届参与这一人工智能产业盛会，与产业链各环节领袖共商人工智能领域前沿技术、产业动向、向善治理。

至顶网业界供稿 2024-07-12 11:57:16

腾讯AI实验室发现：聪明的AI也会"思维跳跃"，新方法让机器学会深度思考

腾讯AI实验室发现先进AI模型存在"思维不足"问题：在解决困难问题时频繁跳跃思路而非深入思考，导致错误答案消耗225%更多资源。研究团队提出TIP方法，通过惩罚思维切换来训练AI专注力，显著提升推理效率和准确性。这项发现改变了我们对AI推理过程的认知，强调深度思考比广度探索更重要。

至顶网科技行者 2025-09-17 13:32:24

图灵奖得主Yoshua Bengio：深度学习当务之急，是理解因果关系

深度学习擅长在大量数据中发现模式，但无法解释它们之间的联系，而图灵奖获得者Yoshua Bengio想要改变这一点。

至顶网科技行者 2019-10-11 16:17:46

2018年亚太CDN峰会，华为云荣获业务创新杰出企业奖

2018年11月13日，由 AsiaOTT 主办的“GFIC2018——亚太CDN峰会年度盛典”在上海盛大召开。作为领先的云服务厂商，华为云凭借CDN业务在业务模式上的创新，荣获 “业务创新杰出企业"奖项。

至顶网业界供稿 2018-11-19 12:07:11

Atla公司发布Selene Mini：一个8B参数的强大语言模型评估器，性能超越GPT-4o-mini

Atla公司发布Selene Mini，这是一个仅有80亿参数的AI评估模型，却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略，该模型不仅能准确评判文本质量，还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源，为AI评估技术的普及和发展做出贡献。

至顶网科技行者 2025-09-15 14:44:11

价值引导搜索：提升推理模型思维链的高效指南——康奈尔大学研究团队的突破性成果

康奈尔大学研究团队提出了"价值引导搜索"方法，通过训练标记级价值模型来优化大型语言模型的推理过程。他们收集了250万个数学推理轨迹，训练了15亿参数的评估模型，实现了基于块的高效搜索。这种方法不需要预定义"步骤"概念，也无需昂贵的每步标注。在四个数学竞赛基准测试中，该方法使DeepSeek-1.5B模型达到了45.7%的平均准确率，与更大模型相当，同时显著减少了计算资源需求。研究团队开源了数据集、模型和代码，为高效人工智能推理提供了新范式。

至顶网科技行者 2025-05-29 12:03:07

滑铁卢大学研究团队突破性发明：让AI像真正的学者一样写论文和找文献

滑铁卢大学研究团队开发出ScholarCopilot，一个革命性的AI学术写作助手。该系统突破传统"先检索后生成"模式，实现写作过程中的动态文献检索和精确引用。基于50万篇arXiv论文训练，引用准确率达40.1%，大幅超越现有方法。在人类专家评估中，引用质量获100%好评，整体表现优于ChatGPT。这项创新为AI辅助学术写作开辟新道路。

至顶网科技行者 2025-07-14 14:39:45

业余爱好者的杰作：AI系统能够准确分辨真假伦勃朗画作

利用业余时间，来自马萨诸塞州的一对夫妇编写出一套系统，据称其能够在高达90%的准确率从图片中识别出伦勃朗的画作。

至顶网科技行者 2019-04-30 11:25:20

深潜大语言模型的"真空地带"：不是所有层都在全力工作，偷懒的层竟然越过越好？

这项研究揭示了大语言模型中存在"空域"——在推理过程中几乎不活跃的神经网络层。研究者开发了L2自适应计算方法，无需额外训练即可准确识别这些空域。惊人的是，在Qwen2.5-7B模型上，跳过70%的层后性能反而从69.24%提升到71.29%；Mistral-7B在GPQA测试中跳过约30%的层后，准确率提高了4.48%。这表明不同模型层的贡献极不均衡，有选择地跳过"懒惰层"不仅能保持性能，有时甚至能提升结果，为未来模型优化提供了新思路。

至顶网科技行者 2025-05-27 10:14:04

MLLMs能帮我找到回家的路吗？——新加坡国立大学等机构发布基于交通地图的细粒度视觉推理基准研究

这项来自新加坡国立大学等机构的研究引入了REASONMAP，一个用于评估多模态大语言模型细粒度视觉理解能力的基准测试。研究团队使用来自13个国家30个城市的高分辨率交通地图，构建了1,008个问答对，设计了两级评估框架测量答案的正确性和质量。对15个流行模型的评估揭示了一个意外发现：开源领域的基础模型表现优于推理型模型，而闭源模型则相反。研究还表明，当视觉输入被遮盖时，模型性能普遍下降，证明真正的细粒度视觉推理任务仍需要有效整合多模态信息。

至顶网科技行者 2025-05-29 20:44:14

Patronus AI突破性发现：大模型在复杂任务中的真实弱点，错误率竟高达89%

Patronus AI发布突破性研究，构建了首个系统性AI代理错误评估体系TRAIL，涵盖148个真实案例和21种错误类型。研究发现即使最先进的AI模型在复杂任务错误识别上准确率仅11%，揭示了当前AI代理系统在长文本处理、推理能力和自我监控方面的重大局限，为构建更可靠的AI系统指明方向。

至顶网科技行者 2025-07-09 11:59:36

人工智能也能看懂手语了？MIT团队让机器秒懂聋人对话的神奇技术

MIT研究团队开发出革命性的手语视频搜索技术，能够通过普通文字搜索找到对应的手语视频内容。该系统运用深度学习建立手语与文字间的语义映射，准确率达到87%，为全球7000万聋人群体打开数字世界大门。技术有望在教育、社交媒体、客服等领域广泛应用，推动建设更包容的数字社会。

至顶网科技行者 2025-08-21 10:01:10

阿里巴巴等机构提出SingLoRA：用一个矩阵就能让AI模型学会新技能的神奇方法

这项由以色列理工学院等机构完成的研究提出了SingLoRA方法，用单一矩阵替代传统LoRA的双矩阵设计，解决了AI模型微调中的稳定性问题。该方法在保持性能的同时将参数量减少一半，在语言理解和图像生成任务中都表现出色，为大模型的高效适应提供了新的解决思路。

至顶网科技行者 2025-07-18 09:34:36

Loona宠物机器人“萌翻”2025中网球场

9月14日至10月5日，ITF青年赛、WTA 1000女子、ATP 500男子等一系列精彩赛事在国家网球中心轮番上演，而在赛场之外，由中国创新机器人企业可以科技推出的Loona宠物机器人，也成为中网“映月球场“拍浪节”科技集市”中备受观众欢迎的“萌宠”伙伴。

至顶网业界供稿 2025-10-10 15:14:34

华东师范大学研究团队让AI预测自己说话的"靠谱程度"：首次实现细粒度实时信心评估

华东师范大学等机构联合开发FineCE方法，首次实现AI系统在文本生成过程中的细粒度实时信心评估。该方法通过蒙特卡罗采样构建训练数据，结合后向信心整合策略，让AI能够准确判断自己答案的可靠性。实验显示在多个基准数据集上显著优于现有方法，为AI安全性和可解释性研究开辟新方向。

至顶网科技行者 2025-09-09 10:55:14

B-score：利用响应历史检测大语言模型中的偏见

这项研究提出了"B-score"，一种新指标用于检测大语言模型中的偏见。研究人员发现，当模型能看到自己之前对同一问题的回答时（多轮对话），它能够减少偏见并给出更平衡的答案。B-score计算单轮与多轮对话中答案概率的差异，无需外部标注即可识别有偏见的回答。实验证明，将B-score用于回答验证可显著提高准确率，在标准基准测试上平均提升2.9个百分点。这一发现不仅提供了实用工具，还表明大语言模型具有自我纠正能力。

至顶网科技行者 2025-05-29 17:21:17

AI视觉智能的色彩感知大考：大学马里兰分校团队揭示多模态模型的"色盲"真相

这项由马里兰大学团队进行的研究首次系统评估了32个主流AI模型的色彩理解能力，发现即使最先进的模型在基础色彩认知上也存在明显不足。研究通过COLORBENCH测试系统，从色彩感知、推理和稳定性三个维度进行评估，揭示了AI在颜色计数、精确提取等任务上的严重缺陷，为改善AI基础认知能力提供了重要参考。

至顶网科技行者 2025-07-15 10:09:00