用了 0.033981秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2181 条
  • 卡耐基梅隆大学破解AI"长思考"的秘密:让机器像人一样深度推理

    卡耐基梅隆大学研究团队通过系统实验揭示了AI长链式推理的关键机制,发现高质量训练数据、精巧奖励设计、合适思考空间和多样化数据是让AI学会深度思考的四大要素。研究表明,通过监督学习初始化加强化学习优化的组合方法,AI能够像人类一样进行分支推理、错误纠正和自我验证,为智能教育、科研辅助和复杂决策等领域应用奠定基础。
    至顶网  科技行者  2025-08-25 10:24:29  
  • 上海人工智能实验室开发VRBench:首个专门评估AI看长视频推理能力的测试平台

    这项由上海人工智能实验室、南京大学和中科院深圳先进技术研究院联合完成的研究,开发了全球首个专门测试AI长视频推理能力的评估平台VRBench。该平台包含1010个多语言长视频和超过9000个多步推理问答对,创新性地采用双重评估机制,既测试AI的答案准确性,也评估推理过程质量。测试结果显示,即使是最先进的AI模型在复杂视频推理任务上仍存在显著不足,特别是推理过程的可靠性方面。
    至顶网  科技行者  2025-06-17 14:36:41  
  • 微软推出CoRAG:让AI学会像侦探一样一步步搜索信息

    微软和人民大学联合开发的CoRAG系统让AI学会了多步骤推理,像侦探破案一样逐步收集信息解答复杂问题。该系统通过训练AI进行分步搜索,在多跳推理任务上比传统方法准确率提升10个百分点以上,并首次在KILT基准测试中创造新纪录。用户可根据需求选择不同计算策略,平衡性能与成本。
    至顶网  科技行者  2025-09-17 13:29:25  
  • HUAWEI CONNECT2020:知识和AI结合,华为云发布知识计算解决方案

    9月24日,在第五届HUAWEI CONNECT,华为云发布基于AI开发平台ModelArts打造的业界首个全生命周期知识计算解决方案,赋能企业打造知识计算平台,实现AI与行业知识高效结合,加速智能化升级。
    至顶网  至顶网存储频道  2020-09-24 10:25:45  
  • 哈佛大学团队揭秘:如何用"心理学+AI"的神奇组合,让机器人学会像人类一样从错误中成长

    哈佛大学研究团队开发出革命性AI训练方法,让机器能像人类一样从错误中学习成长。与传统需要大量正确答案示例的方法不同,新方法让AI系统自主探索并从失败中提取学习信号。实验显示,这种方法在机器人导航、医学诊断等领域表现出更强适应性和创新能力,所需训练数据减少70%,面对新情况时性能更稳定,为AI教育应用和科学研究开辟了新前景。
    至顶网  科技行者  2025-07-07 17:30:39  
  • WEB-SHEPHERD:让网络代理更智能的过程奖励模型

    这项研究介绍了WEB-SHEPHERD,这是首个专为评估网络导航轨迹设计的过程奖励模型。延世大学和卡内基梅隆大学的研究团队创建了包含40K步级别注释的WEBPRM COLLECTION数据集和WEBREWARDBENCH评估基准。实验表明,WEB-SHEPHERD在评估基准上比GPT-4o高出约30个百分点,并且在WebArena-lite上使用时,性能提升了10.9个百分点,同时成本降低了10倍。这一创新模型通过结构化清单将高级用户指令分解为可解释的子目标,为构建更可靠、更经济的网络代理奠定了基础。
    至顶网  科技行者  2025-05-27 11:35:44  
  • 双域稳健性:CLIP模型需要一个稳健的文本编码器

    这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
    至顶网  科技行者  2025-06-08 16:44:33  
  • 苹果新研究:让AI模型变身数学天才的神奇训练法

    苹果研究团队开发了GSM-Symbolic测试框架,揭示了当前先进AI模型在数学推理方面的重大缺陷。通过改变题目表述和添加无关信息,研究发现AI模型更依赖模式记忆而非真正推理,准确率显著下降10-20%。这项研究改变了AI能力评估方式,对教育和商业应用提出新要求,为未来AI发展指明了注重抽象思维培养的方向。
    至顶网  科技行者  2025-09-01 10:43:42  
  • 中软国际5G+工业互联网解决方案赋能企业数字化转型

    金秋九月,2021中国国际信息通信展览会在北京·国家会议中心隆重召开,中软国际重装亮相本次展会,推出基于5G通信技术实现的智慧交通、智慧城市、5GtoB、监审宝等众多优秀解决方案,吸引诸多客户及合作伙伴前来交流探讨。
    至顶网  至顶网网络与安全频道  2021-09-30 18:11:56  
  • 让AI既能看人脸又能听声音:比利时和美国科学家的多感官"读心术"突破

    比利时蒙斯大学和美国南加州大学联合开发了Social-MAE,这是一个能够同时理解人脸表情和声音情感的AI系统。该系统通过分析8个连续视频帧和音频特征,在VoxCeleb2大型社交数据集上进行自监督学习,在情感识别、笑声检测和性格分析三项任务中均达到了业界最佳水平,为智能教育、医疗诊断、人机交互等领域开辟了新的应用前景。
    至顶网  科技行者  2025-09-05 10:12:02  
  • 史上最难的AI人格化考试:连最聪明的模型都考砸了!华为OPPO等联合发布PersonaFeedback基准

    这项由电子科技大学、香港中文大学等机构联合完成的研究,创建了PersonaFeedback基准来评估AI的个性化能力。研究包含8298个测试案例,分为三个难度等级,发现即使最先进的AI模型在个性化任务上表现也不理想。研究还发现推理能力提升不等于个性化能力提升,直接提供用户信息比让AI推测更有效。
    至顶网  科技行者  2025-06-20 10:26:49  
  • 正交残差更新:为深度网络提供稳定高效的更新机制

    这篇研究论文提出了一种称为"正交残差更新"的新方法,解决了深度神经网络中标准残差连接的局限性。研究人员发现,在传统残差连接中,模块输出与输入流直接相加可能导致冗余特征学习。他们的创新方法将模块输出分解为平行和正交两个组件,仅保留正交部分进行更新,促使网络学习更丰富的特征表示。在ResNetV2和Vision Transformer等架构上的实验证明,这种简单修改显著提高了模型准确率和训练稳定性,在ImageNet-1k数据集上使ViT-B模型的表现提升了4.3个百分点。
    至顶网  科技行者  2025-05-28 20:28:17  
  • ServiceNow推出音频大模型评估神器:AI语音助手测评从此不再头疼

    ServiceNow团队开发的AU-Harness是首个专门针对AI语音助手的综合评估工具包。该工具通过创新的并行处理和标准化测试协议,将评估效率提升127%,涵盖19项测试任务。研究引入了两个全新测试类别:时间感知的对话分离和复杂的口语推理能力。通过380多项测试揭示,当前AI语音模型在基础识别方面表现良好,但在复杂推理和时间理解上仍存在显著差距,为未来技术改进指明了方向。
    至顶网  科技行者  2025-09-25 14:40:53  
  • 普林斯顿大学突破:让AI聊天机器人像人一样思考的神奇方法

    普林斯顿大学研究团队开发了TraceRL方法,通过追踪AI推理过程而非仅关注最终答案来训练扩散语言模型。该方法训练出的TraDo系列模型虽然参数规模较小,但在数学推理任务上显著超越大型模型,并首次实现了具备长篇推理能力的扩散语言模型。研究团队已将完整框架开源,为AI可解释性和实际应用提供了重要突破。
    至顶网  科技行者  2025-09-23 13:39:27  
  • 机器学习技术打卦,为宝宝起个好名字

    名字是否会在潜移默化中引导人们倾向于选择与之相符的工作或者生活方式?如果答案是肯定的,那么起名这事学问可就太大了,甚至会影响孩子的一生。
    至顶网  科技行者  2020-08-04 15:32:05  
  • 看这4家企业组织如何利用人工智能彻底变革制造业

    人工智能和机器学习正在变革制造业。根据世界经济论坛去年年底发布的报告,人工智能、先进机器人、增材制造和物联网的结合将共同引领第四次工业革命。
    至顶网  cio.com  2018-10-25 09:00:00  
  • 斑马技术致力于边缘创新 庆祝公司成立50周年

    近日,作为致力于通过其解决方案及合作伙伴助力企业获得性能优势的斑马技术公司庆祝其成立50周年,并将继续致力于赋能企业一线员工。
    至顶网  至顶网软件频道  2019-05-24 11:02:57  
  • Adjust:2024年全球移动营销五大趋势

    随着2024年的开启,全球营销行业将迎来新的变革和创新的浪潮。
    至顶网  业界供稿  2024-01-03 11:49:22  
  • 阿里通义实验室推出WebSailor:首个与顶级闭源系统媲美的开源超级网络智能体

    阿里通义实验室发布首个媲美顶级闭源系统的开源超级网络智能体WebSailor,突破性解决开源模型在超高不确定性任务中的系统性推理难题,在BrowseComp基准测试准确率提升3倍,标志着开源技术在复杂信息搜索领域的历史性跨越。
    至顶网  至顶AI实验室  2025-07-07 16:57:16  
  • AI辅助诊断能否步入日常应用:希望与风险并存

    AI技术“能够还原一个早在10年之前关于特定事件的样貌”,利用患者记录中的不同数据整理出结构化概述。它还可以在各种意外的临床状况之下检测出异常:例如一位56岁的女性感到左胸疼痛,没有外伤史,放射科医生竟然漏诊了她的肋骨骨折。与人类放射科医生不同,人类可能会在对复杂病例的诊断达到一定数量之后陷入停滞,诊断能力再无寸进;而AI却可以提炼出一切可能性,而不会因为病理学层面的影响因素而分心。
    至顶网  至顶网软件与服务频道  2024-08-07 14:05:39  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号