用了 0.024131秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容1376 条
  • 干掉完美主义:多轮分解如何让大语言模型推理更高效

    这项研究提出了"多轮分解"(MinD)方法,将大型推理模型的冗长思维链重构为结构化的多轮对话形式,每轮包含一个思考单元和一个答案。通过监督微调和强化学习相结合的训练策略,MinD在MATH等基准测试上实现了高达70%的标记使用量和首个标记延迟(TTFT)降低,同时保持了竞争性能。研究表明,传统推理模型中存在大量冗余思考过程,而MinD通过"完成比完美更重要"的理念,使模型学会生成更简洁高效的推理过程。
    至顶网  科技行者  2025-05-29 14:48:32  
  • 腾讯混元图像2.0模型正式发布

    5月16日,腾讯发布最新混元图像2.0模型(Hunyuan Image2.0),基于模型架构创新,在行业内率先实现实时生图,在画面质感超写实的基础上,带来全新的AI生图交互体验。模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。
    至顶网  至顶网CIO与CTO频道  2025-05-16 14:02:04  
  • Sherlock:让视觉-语言模型学会自我纠错推理的突破

    这项来自普渡大学的研究展示了一种名为Sherlock的创新框架,让视觉-语言模型具备自我纠错能力。研究者通过三阶段训练方法(SFT冷启动、轨迹级偏好训练和自我改进),使模型能像侦探一样发现并修正推理错误。仅使用20k标注数据,Sherlock在八项基准测试中超越了使用5-13倍数据量的现有模型,证明自我纠错不仅能提升AI可靠性,还能大幅降低训练成本。
    至顶网  科技行者  2025-06-03 07:42:56  
  • 滴滴出席信息检索领域顶级会议SIGIR 分享智能交通经验

    近期,信息检索领域顶级会议ACM SIGIR2018在美国密歇根安娜堡成功举办,滴滴技术团队深度参与了大会,并主办智能交通信息学专题讨论会,详细介绍了滴滴在出行领域的探索和实践并分享了产学研合作经验。
    至顶网  科技行者  2018-07-16 18:09:59  
  • 江行智能升级推出虚拟电厂解决方案 助力资源调度优化及运营效率提升

    近日,中国电力能源数智化践行者——江行智能正式升级推出虚拟电厂解决方案。
    至顶网  科技行者  2023-09-19 21:37:31  
  • 夸克AI视觉技术迈向企业服务 黄锐华:手机扫描效果已超过传统扫描仪

    大模型技术运用在扫描场景后已经发生两方面变化
    至顶网  业界供稿  2024-01-15 11:37:21  
  • 多模态大语言模型能帮助理解人类语言吗?MMLA:一个全面的多模态语言分析基准

    想象一下,你正在看一部喜剧片。剧中角色面无表情地说:"我棒极了。"单看文字,你可能认为这是自信的表达。但如果你看到他说这话时翻了个白眼,用讽刺的语调,你立刻就会理解——这是在自嘲或嘲讽他人。这种理解需要同时分析文字内容、表情和语调。这正是多模态语言分析的核心:通过整合多种信息渠道(如文本、视频和音频),来理解人类交流中的高级语义。
    至顶网  科技行者  2025-04-29 12:19:48  
  • RLVR-World:用强化学习训练世界模型,突破视觉和语言边界的突破性研究

    清华大学研究团队提出RLVR-World框架,通过可验证奖励的强化学习直接优化世界模型的预测质量,而非传统的最大似然估计。这一方法在文本游戏状态预测和网页导航中显著提升了准确率,在机器人视频预测中改善了视觉质量并减少重复问题。RLVR微调仅需几百个梯度步骤即可取得显著成效,远比传统训练高效。研究证明该框架可作为生成模型的通用后训练范式,为自动驾驶、机器人控制等应用提供更准确的环境预测能力。
    至顶网  科技行者  2025-05-27 11:07:05  
  • Galileo 发布新平台用于评估 AI 代理系统

    Galileo 发布了 Agentic Evaluations 平台,用于评估基于大语言模型的 AI 代理性能。该平台提供全生命周期框架,支持系统级和步骤级评估,帮助开发者快速定位inefficiencies和错误。平台使用专有的 LLM-as-a-Judge 指标,支持 LangGraph 和 CrewAI 框架,现已向所有 Galileo 用户开放。
    至顶网  SiliconANGLE  2025-01-24 14:29:48  
  • 统计调查:69%的IT高管无法在没有AI辅助的情况下应对网络安全威胁

    最近一些人工智能的健康和进展状况相关调查、研究、预测和其他定量评估突出显示出人工智能在网络安全防御和评分标准化测试中发挥的作用...
    至顶网  Forbes  2019-08-29 10:05:10  
  • 大数据+AI能与碳中和扯上关系?看这家新能源企业如何操作

    当AI进入落地期,认真思考如何打通大数据与AI应用的关联,才是企业眼前既现实、又关键的一大挑战。
    至顶网  业界供稿  2021-07-15 09:47:28  
  • 打开抗体大门:AI在COVID-19中的潜在应用

    研究人员Parkinson等提出了一种名为RESP的AI管线,能够高效且独立识别出高亲和力的候选抗体。在给定明确的抗体靶标之后,RESP就能选择最适合的抗体来改进现有抗体。在RESP的帮助下,研究人员将现有药物的结合亲和力提升了近20倍。
    至顶网  至顶网软件与服务频道  2023-02-08 16:46:37  
  • 百度输入法AI探索版问世:调动表情、肢体全感官输入

    1月16日,在百度输入法“AI·新输入 全感官输入2.0”发布会上,百度输入法AI探索版正式亮相,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。
    至顶网  科技行者  2019-01-16 19:34:41  
  • 曙光慧眼亮相智能大会 让人脸识别变得如此简单

    大会期间,人脸识别技术作为契合主题的智能技术之一被广泛应用于多个场景之中。“曙光慧眼智能视频人脸识别一体机”(即“曙光慧眼”),为会场及活动酒店构建人脸识别智能场景,在大会期间为国内外嘉宾提供便捷服务,受到与会各界人士的关注及认可。
    至顶网  至顶网服务器频道  2019-05-17 16:31:29  
  • 知识图谱:企业 AI 中的关键纽带

    知识图谱作为连接结构化数据和大语言模型的关键技术,正在引起企业界的广泛关注。它可以帮助企业更好地理解数据之间的关系,提高AI应用的准确性和可解释性。虽然构建知识图谱仍存在技术挑战,但结合生成式AI的新方法正在简化这一过程,有望加速知识图谱在企业中的应用和价值实现。
    至顶网  CIO.com  2025-01-30 18:33:27  
  • TAGS:医学问答中兼顾广度与精度的专家-泛医双智能体框架

    TAGS是一种创新的医学问答框架,结合了泛医和专医两种视角,通过层次化检索和不确定性验证机制提升医学AI回答的准确性。该框架由穆罕默德·本·扎耶德人工智能大学等机构的研究团队开发,无需任何模型微调即可显著提升包括GPT-4o和DeepSeek-R1在内的大型语言模型在九个医学问答基准测试上的表现。TAGS通过模拟医疗专家协作、结构化知识检索和质量控制,解决了现有方法在复杂医学推理中的短板,为构建更可靠的医学AI系统提供了新思路。
    至顶网  科技行者  2025-05-30 11:00:04  
  • 云拿科技——多维视角打造无人商业新模式

    在未来真正通过数字化技术手段,向用户展示产品真正价值的企业是什么样子的呢?现在未来已来,让我们看一下云拿科技是如何利用多维仿真技术实现商业的无人化智能管理。
    至顶网  董培欣  2021-12-30 15:03:54  
  • 为什么AI感知与人类感知无法直接比较?

    人与机器之间的比较性研究,往往受到人类自发解释思维这一强烈偏见的影响。
    至顶网  科技行者  2020-08-27 12:20:51  
  • 搜狗推出千元AI录音笔,支持10种语言方言转写,还会个人同传

    提起搜狗,人们的印象大多是「输入法」以及「搜索引擎」,但基于此,这家公司正在布局 "以语言为核心的 AI 战略"。
    至顶网  周雅  2020-02-26 20:14:16  
  • s3搜索智能体:使用强化学习训练高效搜索,让你的Large Language Models检索能力大增

    伊利诺伊大学研究团队开发的s3框架只需2,400个训练样本,就能超越需要17万个样本的现有方法,大幅提升语言模型的搜索质量。通过将搜索与生成解耦,s3使用"超越朴素RAG的增益"奖励,专注训练搜索智能体而保持生成模型不变。在通用和医学问答任务中,s3均取得最佳性能,同时实现33倍训练速度加快,适用于各类冻结或专有模型,为RAG系统开辟高效新路径。
    至顶网  科技行者  2025-05-29 12:01:08  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号