用了 0.032753秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2181 条
  • AI推理模型真的像宣传的那样聪明吗?Anthropic和Open Philanthropy研究人员揭露评测陷阱

    Anthropic和Open Philanthropy研究人员发现,之前声称AI推理模型存在"准确率崩溃"的研究实际上混淆了推理能力和物理限制。通过重新分析发现,AI模型在遇到输出长度限制时会主动停止,而非推理失败;部分测试题目本身无解却被当作失败案例;改用程序生成方式后,模型在复杂问题上表现出色,揭示了AI评估方法的重要缺陷。
    至顶网  科技行者  2025-06-18 17:44:59  
  • 首个数字化智慧病理科!瑞金医院病理科与华为数据存储共同发布

    5月28日,中法转化医学和精准诊治国际论坛·数字智慧病理发展专题分论坛正式召开。
    至顶网  业界供稿  2023-06-05 12:17:36  
  • 快手团队突破性成果:让AI像爬山一样学会推理,训练效率提升数倍

    快手团队提出RLEP方法,通过经验重放让AI像登山者一样重复成功路径,在数学推理任务上实现训练效率和性能双重提升。该方法分为经验收集和重放训练两阶段,在AIME和AMC竞赛中准确率提升1.7-5.2个百分点,训练速度显著加快,为AI推理能力发展开辟新路径。
    至顶网  科技行者  2025-07-23 10:45:10  
  • 跨省高速“偷漏逃”?问问华为AI摄像机答不答应!

    偷漏通行费,一直以来都是高速公路运营管理的“老大难”问题。仅今年第一季度,某省高速管理局就查处了17.3万辆偷漏费车辆,相关金额高达1389.6万元!若是从全国范围来看,损失更是不可估量。
    至顶网  业界供稿  2019-08-02 11:44:43  
  • 微软研究院揭示AI推理真相:当智能模型遇上变化题目会怎样?

    微软研究院开发的RE-IMAGINE框架通过创新的三层次测试体系(观察、变化、想象),系统评估大型语言模型的真实推理能力。研究发现,即使最先进的AI模型在面对题目变化时表现也会显著下降,揭示了当前AI系统过度依赖统计记忆而非真正逻辑推理的局限性,为AI安全部署和未来发展提供重要指导。
    至顶网  科技行者  2025-06-25 11:36:54  
  • 自我反思助力AI成长:Writer团队提出强化学习优化模型自我纠错能力的突破性研究

    这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
    至顶网  科技行者  2025-06-06 17:31:30  
  • 当机器开始"看懂"人类情感:清华大学团队让AI学会识别表情背后的真实感受

    清华大学研究团队在IEEE Transactions on Affective Computing发表突破性研究,提出双重学习策略让AI准确识别人类面部情感。新方法结合判别性和生成性学习,在多个标准数据集上准确率显著提升3-4个百分点,特别在处理陌生人脸时表现出色。技术有望应用于智能教育、医疗健康、人机交互等领域,但仍需解决文化差异和隐私保护等挑战。
    至顶网  科技行者  2025-07-22 09:50:58  
  • 华为云构建支撑“一网统管”城市治理底座 提升县域“智治力”

    面对城镇化治理过程中不断涌现的新形势、新要求,利用数字技术,通过“一网统管”推动城市管理手段、管理模式、管理理念创新,对促进县城高质量发展、推进城镇化治理体系和治理能力现代化具有重要意义。
    至顶网  业界供稿  2022-05-07 17:30:38  
  • AI视觉亮剑,紫光华智获ICDAR Robust Reading大赛双料冠军

    近日,在全球权威的ICDAR Robust Reading大赛榜单中,紫光华智凭借领先的AI技术优势,在文本行检测与识别两项任务中均斩获第一,并一举刷新榜单记录,
    至顶网  业界供稿  2021-05-10 11:48:51  
  • DOVE:加州大学团队推出"图像信息量自适应表示法",让AI更智能地理解图片

    加州大学研究团队开发的DOVE系统彻底革新了AI图像处理方式,不再用固定长度表示所有图像,而是根据图像复杂度智能调整表示长度。就像人类描述简单白墙只需几句话,而描述繁忙街景需要更多细节一样,DOVE为简单图像分配更少的"视觉词汇",为复杂图像提供更多描述单元。实验证明,这种动态方法不仅节省计算资源,还提升了语义理解能力,在各类视觉任务中表现卓越。其查询条件化变体Q-DOVE更进一步,能根据用户问题聚焦相关图像区域,进一步提高效率与理解能力。
    至顶网  科技行者  2025-06-10 09:24:31  
  • 华为常成:共创数据新价值 共赢智能新时代

    5月27日,在2021中国国际大数据产业博览会-人工智能高峰对话上,华为中国区计算业务部总裁常成发表了题为《共创数据新价值 共赢智能新时代》的演讲
    至顶网  业界供稿  2021-05-28 11:10:21  
  • 超越马尔可夫:贝叶斯自适应强化学习让大语言模型反思性探索更高效

    这项来自西北大学和谷歌的研究突破了传统马尔可夫强化学习的局限,通过贝叶斯自适应RL框架解释了大语言模型中涌现的反思性推理行为。研究团队提出的BARL算法通过维护多个解题策略的后验分布,指导模型何时何地进行反思性探索,在数学推理任务上展现出显著优势,比基线方法减少高达50%的标记使用量,同时提高了准确率。这一研究不仅解释了"为什么反思有用",还提供了实用的指导原则,为AI系统的自适应推理能力开辟了新方向。
    至顶网  科技行者  2025-05-30 17:24:58  
  • 首个突破:首尔国大团队让AI学会"私人定制"看图说话术,多角色一次搞定不再出错

    首尔国立大学团队突破性地提出了基于强化学习的多模态大语言模型个性化训练框架RePIC,仅用2000个样本就达到传统方法21万样本的效果,在多角色图像描述任务中准确率提升至71%(传统方法仅21.3%),首次实现了高效、准确的AI个性化看图说话能力,为个人专属AI助手的普及化应用奠定了重要技术基础。
    至顶网  科技行者  2025-06-27 11:42:01  
  • ByteDance推出Mini-o3:让AI像人类侦探一样深度思考的视觉搜索突破

    ByteDance团队开发的Mini-o3系统通过深度多轮推理突破了传统AI视觉理解的局限。该系统能像人类侦探般进行几十轮的视觉探索,在困难的视觉搜索任务上准确率达48%,相比现有模型提升显著。核心创新包括挑战性的Visual Probe数据集、多样化推理策略训练和突破性的过轮掩码技术,实现了测试时思考轮数的自然扩展。
    至顶网  科技行者  2025-09-23 13:39:46  
  • 巴黎理工学院发现AI换脸新危机:让人类检测准确率下降30%的"局部伪造"技术

    巴黎理工学院研究团队发现了比传统深度伪造更隐蔽的"局部伪造"技术威胁。这种只修改视频局部区域的新型AI造假技术让人类检测准确率下降30%以上,AI检测系统性能下降高达43%。研究团队构建了包含25000个样本的全球首个局部伪造检测数据库FakePartsBench,揭示了现有防御体系面对精细化伪造攻击的脆弱性,为未来开发更强大的检测技术奠定重要基础。
    至顶网  科技行者  2025-09-04 10:03:20  
  • UNC最新突破:AI看视频终于会"思考"了!仅用3.6%训练数据让机器推理能力暴涨

    这项研究开发了VIDEO-RTS系统,仅用传统方法3.6%的训练数据就让AI学会了真正的视频推理能力。系统采用"纯强化学习"跳过死记硬背阶段,结合"稀疏到密集"的自适应推理策略,在五个权威测试中平均准确率提升2.4%。这一突破性进展可能改变AI视频理解的发展方向。
    至顶网  科技行者  2025-07-18 10:01:06  
  • 百度上线首款区块链产品图腾,要让每一张原创图片可溯源、可追踪

    完成产品公测三个月后,百度首个基于区块链技术的原创图片服务平台“图腾”于近日正式上线。
    至顶网  科技行者  2018-07-20 12:22:16  
  • 英特尔王锐:中国数字经济蓝图正在加速绘制

    王锐表示:“数字经济重构了生产要素的供给,重塑了社会的生产力,为整个社会的发展提供了重要的基础和核心动力。”
    至顶网  业界供稿  2021-04-09 15:43:44  
  • 华为云参与AIOps标准工作组,持续推进智能运维

    在9月14日上海开幕的第十届GOPS全球运维大会上,华为云作为AIOps标准工作的成员单位出席了授牌仪式,并接受了颁奖。
    至顶网  业界供稿  2018-09-14 17:18:25  
  • NVIDIA发布OCR-2:用"自我批评"让AI写代码更聪明的新方法

    NVIDIA研究团队开发了OCR-2系统,让AI能够像程序员一样对自己编写的代码进行"自我批评"和改进。他们构建了包含250万个编程问题-解决方案-批评组合的史上最大代码推理数据集,采用两阶段训练方法,让AI既能写代码又能评价代码质量。该系统通过生成多个解决方案并自我筛选,显著提升了代码生成准确率
    至顶网  科技行者  2025-07-22 10:20:20  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号