用了 0.124218秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容12228 条
  • AI模型能否真正理解网络表情包的恶意内容?香港浸会大学团队开发出全新智能检测框架

    香港浸会大学等机构联合开发的AdamMeme框架,通过多AI智能体协作,能够动态生成个性化测试样本来评估AI模型理解网络表情包恶意内容的能力。该框架突破了传统静态评估的局限,针对每个模型的弱点进行深度探测,实验显示即使是GPT-4o等顶级模型也存在认知盲点,为AI安全评估提供了新思路。
    至顶网  科技行者  2025-07-18 09:38:00  
  • 未来,就在我们手中

    如果想要像人类种群那样经历数百万年的进化并最终站在地球食物链的顶端,我们首先得掌握一系列重要能力。
    至顶网  至顶网计算频道  2025-01-09 10:40:56  
  • 市场分析:AI如何再次点燃人们对硬件的兴趣

    多年来,计算机硬件一直是一个乏善可陈的市场。占主导地位的x86微处理器架构正在触达可通过小型化实现性能增长的极限,因此制造商们的目光聚焦于在芯片中封装更多核心上。
    至顶网  至顶网计算频道  2022-11-18 14:31:51  
  • 比亚迪如何从特斯拉手中夺取桂冠的?

    比亚迪本身就是一个开拓者。公司 2003 年才开始生产汽车,是最早使用电动动力系统并逐步淘汰纯汽油动力车型的公司之一。
    至顶网  至顶网软件与服务频道  2023-09-08 17:51:52  
  • 讯飞星火V3.0发布,整体超越ChatGPT,明年上半年对标GPT-4

    对标GPT-4的更大参数规模的星火大模型正式启动训练,2024年上半年将实现对标GPT-4。
    至顶网  至顶网软件与服务频道  2023-10-24 16:38:20  
  • 自我挑战型大语言模型:让AI通过自创问题提升能力

    加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
    至顶网  科技行者  2025-06-07 09:54:04  
  • 从乡下放牛娃到大厂AI顾问:我用本硕七年,重写自己的人生

    LangGPT创始者云中江树的双面人生
    至顶网  杨淼  2024-11-19 09:41:28  
  • 安全科学家:打造风险感知型AI科学家,引领安全的LLM智能发现之路

    伊利诺伊大学香槟分校研究团队开发了SafeScientist,一个安全优先的AI科学家框架,能主动拒绝不道德或高风险任务,并在整个研究过程中确保安全。该框架整合了四层防御机制:提示监控、智能体协作监督、工具使用控制和伦理审查。团队还创建了SciSafetyBench基准测试集,包含240个高风险科学任务和120个工具相关风险场景,用于评估AI科学家的安全性。实验表明,SafeScientist比传统框架提高了35%的安全性能,同时不影响科学输出质量,为AI驱动的科学探索提供了安全与创新并重的新范式。
    至顶网  科技行者  2025-06-03 13:32:56  
  • MM-PRM:通过可扩展的步骤级监督提升多模态数学推理能力

    这篇研究论文介绍了MM-PRM,一种用于增强多模态数学推理能力的过程奖励模型。研究团队首先构建了一个强大的多模态策略模型MM-Policy,然后创建了包含10,000个多模态数学问题的数据集MM-K12。利用蒙特卡洛树搜索(MCTS)框架,他们自动生成了超过70万个步骤级别的标注,无需人工参与。最终的奖励模型在Best-of-N推理设置中显著提升了多个基准测试的性能,包括MM-K12、OlympiadBench和MathVista等。研究还发现软标签、较小的学习率和路径多样性是优化PRM性能的关键因素。
    至顶网  科技行者  2025-05-22 13:57:25  
  • 腾讯邱跃鹏:面向Agent和全球化趋势,全面升级云基础设施

    腾讯云已在推理加速、Agent Infra和国际化布局等方面取得突破,并将以更加开放的姿态,助力企业把握时代机遇。
    至顶网  至顶网CIO与CTO频道  2025-09-16 12:19:55  
  • 微软最新研究:AI训练也要讲究"上菜顺序"——数据排列新方法让机器学习效果提升65%

    微软研究院最新发布的DELT方法革命性地改变了AI训练数据的组织方式,通过给训练样本评分、筛选和重新排序,让AI模型能够循序渐进地学习。这种方法无需增加模型大小或数据量,就能将性能提升1.65%,实现训练效率翻倍,为AI训练带来几乎"免费"的性能提升。
    至顶网  科技行者  2025-07-03 13:55:59  
  • 2022企业数字化转型十大趋势

    事前没有人能预测到,企业数字化转型的进程会在过去两年突然改变。每个行业、每个领域的转型都在加速,并且不断扩大规模。
    至顶网  元年研究院  2022-02-15 15:43:37  
  • WEB-SHEPHERD:让网络代理更智能的过程奖励模型

    这项研究介绍了WEB-SHEPHERD,这是首个专为评估网络导航轨迹设计的过程奖励模型。延世大学和卡内基梅隆大学的研究团队创建了包含40K步级别注释的WEBPRM COLLECTION数据集和WEBREWARDBENCH评估基准。实验表明,WEB-SHEPHERD在评估基准上比GPT-4o高出约30个百分点,并且在WebArena-lite上使用时,性能提升了10.9个百分点,同时成本降低了10倍。这一创新模型通过结构化清单将高级用户指令分解为可解释的子目标,为构建更可靠、更经济的网络代理奠定了基础。
    至顶网  科技行者  2025-05-27 11:35:44  
  • AI也能看懂你的想法?上海AI实验室揭秘社交推理游戏中的"读心术"

    上海AI实验室等机构联合研究开发的InMind框架,通过阿瓦隆社交推理游戏测试AI是否能理解和模仿人类个性化推理风格。研究发现,尽管GPT-4o等先进模型在基础任务表现良好,但在理解个性化推理方面仍有明显不足,大多依赖词汇相似性而非深层推理模式。DeepSeek-R1等推理优化模型展现出更好潜力,为开发更懂人心的AI系统指明了方向。
    至顶网  科技行者  2025-08-29 09:33:30  
  • 波士顿大学研究揭秘:为什么大脑"练得越多,想得越少"?神经科学家发现思维自动化的惊人真相

    波士顿大学研究团队通过先进脑成像技术首次揭示了技能从需要意识控制转变为自动化执行的完整神经过程。研究发现大脑存在两个关键网络:认知控制网络负责新技能学习,程序性学习网络负责自动化执行。随着练习增加,控制权从前者转向后者,释放认知资源处理新挑战。研究还发现了三种不同的个体学习类型,为个性化教育和康复治疗提供科学依据,并为人工智能发展提供生物学启发。
    至顶网  科技行者  2025-06-11 07:51:19  
  • ToolRL:奖励设计是工具学习所需的全部

    想象一下,你拥有一个聪明的助手,它知道很多知识,但在面对需要使用计算器、搜索引擎或查询最新信息时却显得笨手笨脚。这正是当前大语言模型(LLMs)面临的困境。虽然这些模型已经通过监督微调(SFT)学会了使用工具的基本能力,但它们常常在面对复杂或不熟悉的场景时表现不佳。
    至顶网  科技行者  2025-04-23 17:34:10  
  • 阿里巴巴的革命性突破:让AI像人类一样推理的全新机器学习框架

    阿里巴巴达摩院开发的PREL框架通过渐进式学习让AI具备类人推理能力,在复杂推理任务中性能提升超35%。该框架采用多层次架构和动态推理路径,解决了传统AI推理混乱、上下文丢失等问题,已在医疗诊断、金融评估等领域展现应用潜力。
    至顶网  科技行者  2025-08-22 09:34:54  
  • 打造“全球一朵云”,广汽迈入出海3.0时代

    从贸易出海转向海外运营,广汽向全球化迈出重要一步。
    至顶网  金旺  2025-05-30 17:16:55  
  • ReSurgSAM2:新加坡国立大学团队打造的手术视频智能追踪系统,让外科医生用语言指令精准追踪手术工具与组织

    ReSurgSAM2是新加坡国立大学团队开发的两阶段手术视频分割系统,允许外科医生通过文本指令精准识别和追踪手术器械与组织。这项创新利用SAM2模型为基础,添加了跨模态空间-时间Mamba、可靠初始帧选择和多样性驱动长期记忆机制,解决了现有技术在长时间追踪和实时性能方面的局限。实验表明,该系统在准确性上显著超越现有方法,同时保持61.2 FPS的实时处理能力,为手术认知辅助、教育和导航提供了强大工具。
    至顶网  Hugging Face  2025-05-16 16:41:21  
  • 总编对话丨世纪互联蓝云CEO刘启航眼中的云计算

    近日,中国电子报总编辑胡春民与刘启航就云计算产业发展展开了深度对话。
    至顶网  业界供稿  2020-07-22 14:51:21  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号