用了 0.030397秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容1873 条
  • SynthRL:新加坡国立大学团队如何通过可验证数据合成提升视觉推理能力

    新加坡国立大学研究团队开发的SynthRL是一种创新的数据合成管道,旨在提升视觉语言模型的推理能力。该方法通过三阶段流程自动生成更具挑战性的训练数据:首先基于难度选择模型已掌握的简单问题,然后生成保留原始答案的更复杂变体,最后验证问题的正确性与难度增加。应用于MMK12数据集后,研究生成了3300多个高质量问题,并在五个视觉数学推理基准上实现显著性能提升,尤其在最困难的样本上效果最为明显。这一研究证明了智能数据合成在增强AI推理能力方面的重要价值,为视觉语言模型的进一步发展开辟了新途径。
    至顶网  科技行者  2025-06-06 17:28:14  
  • G-FOCUS:迈向评估UI设计说服力的稳健方法

    想象一下:你是一家电商平台的设计师,正在设计一个产品详情页。你创建了两个版本:一个将"加入购物车"按钮设计得更大且颜色鲜艳;另一个则将按钮设计得较小但位置更靠上。哪个设计更能说服用户购买产品?传统做法是通过A/B测试来获取答案——将两个版本随机展示给不同用户,统计哪个版本带来更高的点击率或转化率。
    至顶网  科技行者  2025-05-13 15:29:13  
  • 人工智能学会了如何在探索与利用之间找平衡:中国人民大学提出的新训练方法让AI更聪明

    中国人民大学和字节跳动联合提出Pass@k训练方法,通过给AI模型多次答题机会来平衡探索与利用。该方法不仅提升了模型的多样性表现,还意外改善了单次答题准确率。实验显示,经过训练的7B参数模型在某些任务上超越了GPT-4o等大型商业模型,为AI训练方法论贡献了重要洞察。
    至顶网  科技行者  2025-08-18 14:00:18  
  • 深信服桌面云,让运维再简单一点

    相比于传统pc,桌面云赢得企业用户青睐的一大特性就是其省心便捷的运维能力。
    至顶网  业界供稿  2022-11-08 14:55:46  
  • UCloud优刻得发布三大系列AI智能边端产品 开放技术能力打造AI应用生态

    3月17日,UCloud优刻得举办了主题为“让AI离你更近”的AI新品发布暨合作伙伴招募大会。会上共发布三大系列AI智能边端产品,并首次推出UCloud AI合作伙伴开放平台,通过全面开放AI产品能力,打造“离用户、场景、伙伴更近”的AI应用新生态。
    至顶网  业界供稿  2022-03-17 11:25:55  
  • 复旦大学推出OmniAVS:让AI看懂、听懂并解释视频中的每一个细节

    复旦大学研究团队推出OmniAVS数据集和OISA系统,实现AI对音视频内容的全模态理解和推理。该系统支持8种表达方式的复合指令,能同时处理文字、语音、声音、图片信息,不仅准确识别目标对象还能解释判断过程。在多项测试中表现出色,为智能教学、医疗诊断、安全监控等领域应用奠定基础。
    至顶网  科技行者  2025-08-05 13:23:39  
  • 月之暗面Kimi K2在关键基准测试中超越GPT-4——且完全免费

    中国AI初创公司月之暗面发布开源语言模型Kimi K2,采用万亿参数混合专家架构,在编程和自主代理任务上表现卓越。该模型在SWE-bench等关键基准测试中超越GPT-4,同时提供免费开源版本和低价API服务。Kimi K2具备强大的"代理"能力,能自主使用工具、编写代码并完成复杂多步骤任务,标志着开源AI模型首次在综合能力上追平甚至超越闭源竞品,可能重塑AI行业竞争格局。
    至顶网  VentureBeat  2025-07-14 09:55:00  
  • 量子机器学习的新突破:爱尔兰都柏林大学团队发现Vision Transformer嵌入让量子计算机在图像识别上首次超越经典算法

    爱尔兰都柏林大学研究团队发现了量子机器学习的重要突破:通过Vision Transformer嵌入,量子支持向量机首次在图像识别任务上显著超越传统算法,在Fashion-MNIST上提升8.02%准确率。研究揭示量子优势关键在于选择合适的数据表示方法,而非单纯依赖量子算法。
    至顶网  科技行者  2025-08-07 14:18:42  
  • 慧营销——青岛银行对公智能营销管理平台

    青岛银行在对公营销数字化转型方面面临多方面的难点和痛点,为解决发展问题,青岛银行全面推进数字化转型战略,打造对公智能营销管理平台——慧营销。
    至顶网  至顶网CIO与CTO频道  2024-01-04 00:26:11  
  • 微软研究院重大突破:更稳定高效的大语言模型强化学习算法—OPO如何解决算法不稳定和计算浪费问题

    微软研究院推出的"基于最优奖励基线的在策略强化学习"(OPO)算法解决了大语言模型强化学习中的两大问题:训练不稳定和计算效率低。通过严格遵循在策略训练和引入理论最优奖励基线,OPO无需额外的辅助模型或复杂正则化项,就能实现更稳定的训练。在数学推理基准测试中,OPO不仅表现优异,还保持了更低的策略偏移和更高的输出多样性。这项研究证明,有时最有效的解决方案不是增加复杂性,而是回归基础原则并进行深入的理论思考。
    至顶网  科技行者  2025-06-03 17:00:55  
  • 软通动力:AI应用已加速铺开,深入布局金融、汽车、互联网等多领域

    软通动力作为昇腾万里认证级应用软件伙伴,基于昇腾AI基础软硬件平台,打造出了AI端云一体化产品(昇腾版)
    至顶网  至顶网人工智能频道  2023-03-08 14:33:51  
  • 华东理工大学团队突破AI智能体识别难题:多轮对话让机器像人一样"边看边想"

    华东理工大学团队提出I2CR框架,通过"文字优先、视觉辅助"的多轮反思机制解决多模态实体链接难题。该框架模仿人类认知过程,先用文字信息判断,再通过内部一致性检查和跨模态验证,必要时引入OCR、图像描述等视觉线索进行迭代优化。在三大数据集上准确率分别提升3.2%、5.1%、1.6%,达到业界最佳性能。
    至顶网  科技行者  2025-08-13 09:22:47  
  • SVGenius基准测试:大语言模型在SVG理解、编辑和生成方面的全面评估

    浙江大学研究团队开发的SVGenius是首个综合评估大语言模型SVG处理能力的基准测试系统。该研究涵盖2,377个测试样例,评估了22种主流AI模型在理解、编辑和生成三个维度上的表现。结果显示,虽然专有模型如Claude和GPT-4o表现最佳,但随着SVG复杂度增加,所有模型性能都明显下降;强化推理训练比单纯扩大模型规模更有效;风格转换是最具挑战性的任务。这一研究为开发更先进的AI辅助设计工具提供了关键见解,有望推动矢量图形技术发展和设计工作流程变革。
    至顶网  科技行者  2025-06-08 09:31:21  
  • 被难倒的视觉语言模型:为什么人工智能看不懂视觉谜题?

    这项研究揭示了视觉语言模型在解决视觉文字谜题方面的重大局限性。研究团队通过432个手工注释的谜题数据集,评估了从OpenAI到Google等多家公司的AI模型表现。结果显示,即使最先进的模型在抽象推理、横向思维和理解视觉隐喻方面仍然表现不佳,尤其在识别物体缺失和文化参考上存在显著差距。研究还发现,模型对直接视觉输入的依赖程度很高,特别是推理类模型。这些发现对未来开发更具人类化理解能力的AI系统提供了重要指导。
    至顶网  科技行者  2025-06-04 11:14:01  
  • COP26落幕:谷歌和AWS积极利用机器学习预测洪灾和火灾

    谷歌和AWS此前曾强调他们在机器学习模型方面展开工作,将有助于各国应对世界各地日益频繁发生的环境危机。
    至顶网  至顶网CIO与CTO频道  2021-11-11 14:26:32  
  • 训练成本低至惊人!MiniMax 开源Flash Attention机制的 M1 推理模型

    训练成本低至惊人!MiniMax 开源Flash Attention机制的 M1 推理模型
    至顶网  至顶AI实验室  2025-06-20 17:42:54  
  • 印度学生的数学神器:Physics Wallah团队打造出专门为JEE考试优化的AI数学助手Aryabhata

    Physics Wallah团队开发的Aryabhata 1.0是专为印度JEE数学考试优化的70亿参数AI模型。通过融合三个不同特长的数学模型,使用25万道精选题目进行训练,并采用创新的强化学习技术,Aryabhata在2025年JEE考试中取得86%-90%的准确率。该模型不仅解题精确,更能提供清晰的教学指导,已开源发布,标志着AI教育应用的重要突破。
    至顶网  科技行者  2025-08-15 08:49:28  
  • 每一块废钢的价值,用友智能判级系统都看得见

    废钢作为唯一可大量替代铁矿石的战略资源,其回收再利用产生的交易额高达9000亿。
    至顶网  业界供稿  2023-09-08 13:46:31  
  • 开放跨任务多语言人类偏好数据集:NVIDIA的HelpSteer3引领全面评估奖励建模

    NVIDIA最新发布的HelpSteer3-Preference是一个包含超过4万个样本的开放许可偏好数据集,涵盖STEM、编程和多语言等多样化任务。由专业标注者标注的高质量数据使研究团队训练出在RM-Bench和JudgeBench基准上分别取得82.4%和73.7%准确率的顶尖奖励模型,比现有最佳模型提升约10%。研究还展示了如何利用这些奖励模型通过RLHF对齐大语言模型,在MT Bench和Arena Hard等评估基准上取得显著提升。这个以CC-BY-4.0许可证发布的数据集为开发更好的通用领域指令型语言模型提供了宝贵资源。
    至顶网  科技行者  2025-05-23 07:58:07  
  • 人工智能改变牙科服务的六大趋势

    难道已经有机器人牙医了吗?还没有……。但是,牙科诊所已经加快了将新兴技术融入常规诊疗的步伐。人工智能也不例外。事实上,人工智能正在显著改变牙科行业。
    至顶网  至顶网软件与服务频道  2023-12-14 18:35:44  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号