用了 0.054606秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容1889 条
  • 拆解视频大语言模型评测基准:知识、空间感知还是真正的时序理解?苹果公司研究团队带来新分析框架

    这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
    至顶网  科技行者  2025-06-03 20:42:21  
  • 联通数科李广聚:三年耕耘拉开5G+工业互联网序幕,未来前景可期

    8月31日-9月2日,2021世界5G大会在北京亦创国际会展中心举行。
    至顶网  业界供稿  2021-09-02 17:38:47  
  • 复杂场景下的AI视觉难题:清华、牛津联合发布史上最困难的视频分割挑战MOSEv2

    复旦大学联合牛津大学等机构发布MOSEv2数据集,这是目前最具挑战性的视频目标分割基准。数据集包含5024个复杂场景视频,涵盖恶劣天气、密集人群、目标消失重现等真实世界挑战。测试结果显示,包括SAM2在内的先进AI模型性能大幅下降,从理想数据集的90%+准确率降至50%左右,揭示了AI技术与实际应用需求的巨大差距。
    至顶网  科技行者  2025-08-12 14:15:25  
  • MatTools:香港大学研究团队打造全新材料科学大模型基准测试工具

    香港大学研究团队开发的MatTools是首个全面评估大语言模型在材料科学工具应用能力的基准测试框架。研究发现通用型大模型(如GPT-4o)显著优于专业材料科学模型;AI生成的文档作为检索源比原始代码或官方文档更有效;简单的自反思系统反而优于复杂的多代理架构。这项研究为AI辅助科学工具的设计提供了全新思路,强调"通才胜于专才"、"AI懂AI"和"简单更好"的原则,有望加速材料科学研究和技术创新。
    至顶网  科技行者  2025-05-21 14:28:51  
  • MIT和IBM联手创新:TANGO框架通过互促进方式强化大语言模型的推理能力

    麻省理工学院与IBM研究团队共同开发的TANGO框架通过强化学习同时训练大语言模型的生成器和验证器,实现双向互促进的能力提升。不同于传统方法使用固定验证器,TANGO的验证器随生成器共同演进,提供精确的步骤级反馈。实验证明,这种"探戈式"协作方式使模型在数学竞赛问题上平均提升25.5%,特别是在最具挑战性的AIME 2025竞赛上准确率翻倍。TANGO还将训练效率提高3.3倍,验证器在无需步骤级标注的情况下也达到了业界领先水平,为大语言模型的推理能力增强开辟了新思路。
    至顶网  科技行者  2025-05-27 15:32:45  
  • 让计算机学会"量身定制"的思考:KAIST开发的智能递归深度调节系统

    KAIST研究团队开发了名为MoR的智能递归深度调节系统,该系统能够根据词语复杂程度自动分配计算资源,实现了参数共享、自适应计算和智能缓存的统一。实验显示,MoR在使用更少参数的情况下仍能提升准确率1-2个百分点,处理速度提升20-100%。这项技术为AI发展提供了新的高效计算模式。
    至顶网  科技行者  2025-07-22 09:24:58  
  • Dell PowerProtect全面升级,助力企业强化网络韧性与恢复能力

    Dell PowerProtect以持续创新助力企业提升网络韧性、简化恢复流程,在持续演进的网络威胁环境中筑牢数据安全防线
    至顶网  业界供稿  2025-08-13 10:47:25  
  • 摩根士丹利开放源码:Q语言编程新突破,让AI掌握金融界专用代码语言

    摩根士丹利研究团队开发了专门掌握Q编程语言的AI模型QQwen,通过创新的三阶段训练方法(预训练、监督学习、强化学习),让开源AI模型在Q语言编程测试中达到59%准确率,超越GPT-4.1等商业模型。研究团队完全开源了模型、数据和训练代码,为AI专业化训练提供了可复制的成功范式,证明了中等规模开源模型通过针对性训练可以在特定领域超越大型商业模型的表现。
    至顶网  科技行者  2025-08-15 09:06:51  
  • 微软发布Project Ire智能体,可大规模自动识别恶意软件

    微软推出名为Project Ire的人工智能代理,能够大规模自动分析和分类恶意软件。该AI模型可对可疑软件文件进行逆向工程,使用反编译器等取证工具分析代码以判断文件安全性。在公共数据集测试中,准确率达98%,召回率为83%。在涉及4000个"高难度目标"文件的实际测试中,准确率为89%,误报率仅4%。Project Ire将集成到Defender平台中,用于威胁检测和软件分类。
    至顶网  SiliconANGLE  2025-08-07 07:45:35  
  • 华为科技的AI新突破:电脑也能像人一样"看脸识年龄"!COMSATS大学团队让广告投放更精准

    巴基斯坦拉合尔COMSATS大学研究团队开发出同时识别人脸年龄和性别的AI系统,专门针对精准广告投放优化。该系统性别识别准确率达95%,年龄估算平均误差仅5.77年。与传统分别处理两项任务的方法不同,研究采用统一框架学习共享特征表示,显著提升了整体性能。系统基于20000张人脸图像训练,为商业广告和智能监控等领域提供了新的技术解决方案。
    至顶网  科技行者  2025-07-29 12:02:34  
  • 东华师范大学团队突破:34M轻量级模型挑战632M巨型AI,在图像分割任务中实现逆袭

    东华师范大学团队提出MLLMSeg框架,仅用34M参数的轻量级模型在图像分割任务中超越了632M参数的传统SAM模型。该方法通过创新的DSFF特征融合模块,充分挖掘多模态大语言模型视觉编码器的潜力,将细节特征与语义特征完美结合,在RefCOCO等标准数据集上取得领先性能,为移动设备部署和实际应用提供了高效解决方案。
    至顶网  科技行者  2025-08-13 10:55:26  
  • 巴黎萨克雷大学突破图网络公平性难题:让AI生成的关系网络告别偏见

    这项研究首次系统性解决了图扩散模型的公平性问题,提出了FAROS框架,通过在生成过程中智能切换节点属性来消除偏见。该方法无需重新训练模型,在保持准确性的同时显著提升了公平性,在多个数据集上实现了帕累托最优的性能权衡,为构建更公平的AI系统提供了实用工具。
    至顶网  科技行者  2025-07-18 09:33:47  
  • 「云启江夏 普惠智造」媒体行走进江夏 共同见证江夏制造业转型升级这三年

    2022年,包括湖北卫视、湖北日报、极目新闻、江夏融媒等在内的多家湖北主流媒体走进江夏区政府、走进运营公司、走进华为、走进江夏区标杆上云企业
    至顶网  业界供稿  2022-12-12 14:25:44  
  • Meta推出ReasonIR-8B:让AI"懂推理"的智能检索系统问世

    Meta推出首个专门针对推理任务的智能检索系统ReasonIR-8B,突破传统关键词匹配局限,能真正理解复杂问题并找到有助解决问题的信息。该系统通过创新的ReasonIR-Synthesizer训练方法,在推理密集型检索任务上创下新纪录,计算效率比传统方法提升200倍。技术已开源,为教育、医疗等领域带来智能化信息检索新可能。
    至顶网  科技行者  2025-07-15 11:36:27  
  • 医生眼中的AI助手:让CT扫描诊断更精准的"两步走"智能系统

    来自印度维洛尔理工学院的研究团队开发了UGPL系统,这是一种模仿医生诊断思路的AI技术,能够智能分析CT扫描图像。系统采用"先看森林再看树"的策略,首先进行全局分析识别可疑区域,然后重点检查这些区域。在肾脏疾病、肺癌和COVID-19三项诊断任务上,准确率分别提升了3.29%、2.46%和8.08%,为医疗AI发展指出了新方向。
    至顶网  科技行者  2025-07-25 11:46:39  
  • 清华大学团队揭秘:AI能否摆脱搜索引擎,靠"内功"回答一切问题?

    这项由清华大学等机构联合进行的研究发现,AI大语言模型实际储存了大量世界知识,通过创新的自搜索强化学习方法,可以让AI学会更好地利用内部知识储备回答问题,而不依赖外部搜索引擎。研究证明这种"内功"训练不仅提升了AI的自主搜索能力,还能与真实搜索引擎完美配合,为降低AI应用成本和提高系统可靠性开辟了新路径。
    至顶网  科技行者  2025-08-20 10:24:55  
  • 超越数字反馈:Critique-GRPO如何帮助大语言模型通过自然语言批评提升推理能力

    这项研究提出了Critique-GRPO,一种创新的在线强化学习框架,将自然语言批评与数字反馈相结合,克服了传统仅用数字反馈的三大局限:性能瓶颈、自我反思效果有限和顽固性失败。实验表明,该方法使大语言模型能够从错误中学习并改进,在八项数学和通用推理任务中,将Qwen2.5-7B和Qwen3-8B模型的平均通过率分别提高了约4.5%和5%,超越了包括那些引入专家示范的方法。研究还揭示,高熵探索和长回答并不总是最有效的学习方式,质量更重要。这一方法为大语言模型的自我提升能力开辟了新路径。
    至顶网  科技行者  2025-06-07 17:00:24  
  • 如何实现人工智能从AI2.0向AI3.0的跃迁?英特尔中国研究院院长指明方向

    人工智能已经又70多年的发展历史了。目前我们所处的阶段是以深度学习为主导的AI2.0阶段,为了满足更高的要求以及实现更全面的智能,人工智能正在往更高的阶段AI3.0迈进。
    至顶网  业界供稿  2020-06-22 17:57:37  
  • 筑牢“通话安全”防线,鼎桥行业定制终端不止一把“安全锁”

    对此,鼎桥行业定制终端从“端、管、云”打造了立体安全防护体系。而鼎桥为行业定制终端的通话安全所构筑的“黑科技”防线可不止一把“安全锁”。
    至顶网  业界供稿  2022-06-30 16:02:00  
  • GLiNER2:小巧高效的信息提取神器,让AI文档处理从GPU"搬"到CPU

    GLiNER2是Fastino AI开发的统一信息提取系统,仅用2亿参数就集成了命名实体识别、文本分类和层次化结构提取三大功能。该系统最大亮点是完全支持CPU运行,无需GPU显卡,处理速度比同类模型快40倍,准确率达到72%。采用Apache 2.0开源协议,用户可通过pip免费安装使用,为企业和个人提供了高效、安全、低成本的文档处理解决方案。
    至顶网  科技行者  2025-07-29 12:02:11  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号