用了 0.050924秒,为您找到信誉 最好 靠谱 大发 平台 罔芷 88pkee 驻测相关内容3710 条
  • 武汉大学团队让AI学会"诊断"金融知识:像医生检查身体一样评估AI模型

    武汉大学团队开发出FinCDM金融AI认知诊断框架,首次将教育心理学的认知诊断理论应用到金融AI评估中。该框架能像医生体检一样精确诊断AI模型在70个金融概念上的具体掌握情况,而非传统的粗糙总分评估。研究构建了基于CPA考试的高质量数据集,对30个AI模型的测试揭示了模型间的隐藏差异和现有评估的盲区,为金融AI的精准选择和针对性改进提供了重要工具。
    至顶网  科技行者  2025-09-09 10:37:25  
  • 德国研究团队突破医学图像分割难题:无需训练就能让AI医生变得更聪明

    德国研究团队开发出MedSAMix技术,这是一种无需训练的AI模型融合方法,专门用于医学图像分割。该技术通过智能组合现有的通用型和专用型AI模型,在25个医学影像任务上实现了显著性能提升,单任务场景下提升6.67%,多任务场景下提升4.37%。与传统需要大量GPU和数天训练的方法相比,MedSAMix仅需2-4块GPU和数小时即可完成优化,大幅降低了医疗AI的应用门槛和成本,为医疗机构提供了更经济高效的智能诊断解决方案。
    至顶网  科技行者  2025-08-28 11:07:21  
  • 视频生成黑科技:腾讯团队仅用1%参数就让AI精准识别人脸,一张照片秒变高质量视频

    腾讯微信视觉团队提出Stand-In框架,仅用1%参数实现高质量身份保持视频生成。该方法通过条件图像分支和受限自注意力机制,让AI在生成视频时能持续参考原始照片,确保人物面部特征一致。在多项评测中表现优异,面部相似度0.724,支持零样本泛化到非人类主体,可即插即用集成到各种应用中。
    至顶网  科技行者  2025-08-18 13:57:11  
  • 大语言模型能当期刊审稿人吗?耶鲁团队首创AI论文评审基准测试

    耶鲁大学团队首创AI论文审稿基准测试系统LIMITGEN,通过人工植入缺陷和真实审稿数据两套测试集,系统评估大语言模型识别科学论文局限性的能力。结果显示AI审稿准确率约52%,远低于人类专家的86%,但检索增强技术和多智能体协作显著提升了性能,为AI辅助学术评议提供了新思路。
    至顶网  科技行者  2025-07-07 09:18:58  
  • 浙江大学等联合发现:AI也有"舒适圈"现象,不同强化学习效果差异的秘密

    浙江大学等联合研究发现,AI强化学习效果取决于"模型-任务对齐"程度。当AI擅长某任务时,单样本训练、错误奖励等非常规方法也有效;但面对陌生任务时,这些方法失效,只有标准训练有用。研究团队通过大量实验证实,这种"舒适圈"现象比数据污染更能解释训练差异,为AI训练策略优化提供了新思路。
    至顶网  科技行者  2025-09-05 15:13:29  
  • UC伯克利大学突破性发现:让AI"眼睛"更清晰的神奇方法,无需重新训练!

    UC伯克利研究团队发现了一种革命性方法,能够在不重新训练的情况下修复AI视觉系统的注意力异常问题。他们识别出少数"寄存器神经元"是造成注意力噪点的根源,并开发出"测试时寄存器"技术,将这些异常重定向到专门区域。该方法在多项视觉任务中表现出色,性能媲美专门训练的系统,同时还能抵御印刷攻击,为AI视觉技术的实际应用提供了简单高效的改进方案。
    至顶网  科技行者  2025-06-13 08:03:46  
  • 不用看到论文全文也能明白:VeriGUI让AI智能体学会"复杂电脑操作"的创新数据集

    VeriGUI是新加坡南洋理工大学等机构开发的GUI智能体训练数据集,专门用于教AI学会复杂电脑操作。该数据集最大创新是将复杂任务分解为可独立验证的子任务,每个任务平均包含214个操作步骤,涵盖网页和桌面两大场景。目前最先进AI智能体测试成功率仅8.5%,显示了数据集的挑战性,为开发真正实用的数字助理AI奠定了重要基础。
    至顶网  科技行者  2025-08-11 14:29:19  
  • IBM缪可延:watsonx的三大“x因子”之我见

    发布watsonx是IBM推进混合云与AI战略、助力企业云智转型的又一里程碑。
    至顶网  业界供稿  2023-10-10 13:13:42  
  • 颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR

    颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR
    至顶网  至顶AI实验室  2025-07-17 17:24:04  
  • 汽车业驶进白银时代:新势力的第一次车展,或者最后一次

    一方面,华为、BAT等科技和互联网公司正在打破汽车业的传统集中度。另一方面,新晋亮相车展的新兴厂商们实现车型量产,并不意味着它们将进入收获期,未来的一两年时间才是生死大考。
    至顶网  张翔  2019-05-05 15:39:47  
  • AI模型学会"深度思考":马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

    马里兰大学团队开发了名为Huginn的新型AI架构,通过让3.5B参数的小模型学会"深度思考",在推理任务上达到了50B参数大模型的性能水平。该模型采用循环深度设计,可根据问题复杂度进行1-64轮思考,在数学推理和编程任务中表现出色。这项突破证明了通过优化思考过程而非单纯增加参数规模来提升AI能力的可行性,为更高效、经济的AI发展开辟了新路径。
    至顶网  科技行者  2025-08-26 12:00:26  
  • 数学天才都被AI算哭了!斯坦福大学推出史上最难数学考试,连最强AI模型都只能考42分

    斯坦福大学研究团队开发了史上最具挑战性的AI数学推理测试系统Putnam-AXIOM,基于威廉·洛威尔·普特南数学竞赛的522道大学级难题。测试结果显示,即使最强的AI模型也只能达到42%的正确率,远低于它们在传统测试中的表现。研究还创新性地引入了变形题目生成和教师强制准确率评估方法,有效识别了AI对训练数据的记忆依赖问题,为真实评估AI数学推理能力提供了新标准。
    至顶网  科技行者  2025-08-15 15:06:29  
  • 多伦多大学团队发明神奇"洗牌法",让AI画画更精美,不用额外训练就能生成超逼真图像

    这项由多伦多大学等机构联合完成的研究提出了令牌扰动引导(TPG)技术,通过"洗牌"操作改进AI图像生成质量。该方法无需额外训练即可显著提升图像生成效果,在无条件生成中质量指标提升近2倍,条件生成中接近最先进CFG技术的表现。TPG具有即插即用、通用性强的特点,为AI图像生成技术发展提供了新思路。
    至顶网  科技行者  2025-06-18 10:45:08  
  • 汽车人开跑、数字人耍宝、跳水队训练神器…百度世界大会2021重点都在这

    科技未来可期,值得我们共同奔赴。
    至顶网  高玉娴  2021-08-18 18:43:15  
  • 数据“大家”谈 I 邬贺铨:AI时代的数据要素开发与治理

    中国工程院院士邬贺铨讨论了人工智能的发展,从IBM的深蓝到AlphaGo再到ChatGPT,展示了AI从判别式到生成式的进步。他强调了数据在AI时代的重要性,提出了数据共享与开放的必要性,并指出中国在数据产量和存储量上与美国存在差距。他还提到了政府数据的利用率不高,需要改进数据共享和开放机制。邬贺铨建议加强数据治理,提升数据安全,促进社会数字化,并强调了大模型技术在社会治理中的潜力与风险。
    至顶网  国脉数据资产  2024-04-15 22:04:35  
  • 斯坦福大学突破:AI能否像人类一样判断创意写作的好坏?

    斯坦福大学研究团队创建了全球首个创意写作评估基准LitBench,通过分析Reddit写作社区的4万多对故事比较数据,训练AI模型判断创意写作质量。研究发现专门训练的小型奖励模型(78%准确率)能超越大型语言模型评委(73%),但添加推理链反而降低了表现,揭示了创意评判需要直觉性判断的特点。
    至顶网  科技行者  2025-07-11 09:48:53  
  • 南京大学与伦敦大学学院联合推出评估编程助手"侦察能力"的新基准,解决智能编程工具"模糊推理"难题

    南京大学与伦敦大学学院联合开发了CONTEXTBENCH基准,专门评估编程助手的代码上下文检索能力。研究发现复杂助手并不优于简单工具,当前助手普遍存在信息整合障碍,平均丢失17.9%-43.5%的正确信息。该研究通过1136个真实任务和专家标注,揭示了智能编程工具的可靠性问题,为行业发展提供重要警示。
    至顶网  科技行者  2026-02-12 13:28:59  
  • 语音也能变身:复旦大学和阿里巴巴联手打造全球首个语音风格适应评测基准VStyle

    复旦大学和阿里巴巴联合推出VStyle,这是全球首个专门评估AI语音风格适应能力的基准测试。该研究解决了当前语音AI只关注"说什么"而忽视"怎么说"的问题,提出包含声学控制、自然指令、角色扮演、情感共情四类测试的1523个双语指令集。创新性地使用大型音频语言模型作为评判系统,实现了接近人类专家水平的评估一致性。测试结果显示商业系统明显优于开源系统,为语音AI向更自然人性化交互发展提供了重要技术基准。
    至顶网  科技行者  2025-09-25 14:41:20  
  • UNC最新突破:AI看视频终于会"思考"了!仅用3.6%训练数据让机器推理能力暴涨

    这项研究开发了VIDEO-RTS系统,仅用传统方法3.6%的训练数据就让AI学会了真正的视频推理能力。系统采用"纯强化学习"跳过死记硬背阶段,结合"稀疏到密集"的自适应推理策略,在五个权威测试中平均准确率提升2.4%。这一突破性进展可能改变AI视频理解的发展方向。
    至顶网  科技行者  2025-07-18 10:01:06  
  • EgoZero:从智能眼镜到机器人学习的零数据迁移革命

    这项研究介绍了EgoZero,一种创新的机器人学习系统,能够仅通过Project Aria智能眼镜捕获的人类示范数据,训练出零样本迁移的机器人操作策略。研究团队提出了一种形态无关的状态-动作表示方法,使用点集来统一人类和机器人数据,并开发了从原始视觉输入中提取准确3D表示的技术。在没有任何机器人训练数据的情况下,EgoZero在7种真实世界操作任务上实现了70%的成功率,展示了强大的泛化能力,为解决机器人学习中的数据瓶颈问题提供了新思路。
    至顶网  科技行者  2025-05-30 11:18:05  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号