用了 0.093565秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容1229 条
  • Orange Research新突破:DivMerge让AI模型像搭积木一样智能组合,多任务性能大幅提升

    Orange Research团队开发的DivMerge技术实现了AI模型合并的重大突破,通过基于信息论的Jensen-Shannon散度优化,能够将多个专门模型智能组合成保持各自专长的"超级模型"。该技术在双任务合并中达到99.18%性能保持率,显著优于传统88.48%的水平,且在多任务场景下展现更好扩展性,仅需25个样本即可有效工作,为AI应用降本增效提供了新路径。
    至顶网  科技行者  2025-09-22 14:55:27  
  • 聊天机器人用的词典可以更省电?西班牙研究团队发现AI"节能密码"

    这项研究首次系统探索了为聊天机器人定制词汇处理系统的节能潜力。通过对8个主流AI模型的测试,发现专门优化的tokenizer可减少5-10%的token数量,直接转化为相应的能耗降低。在全球AI服务规模下,这种看似微小的优化能带来显著的环保和经济效益,为AI可持续发展提供了新思路。
    至顶网  科技行者  2025-06-30 10:53:55  
  • 小模型也能学会深度思考:UCLA团队让2B视觉AI实现类人推理突破

    UCLA团队首次成功让20亿参数的小型视觉AI模型实现了类似DeepSeek R1的"啊哈时刻"现象。他们通过在未经指令微调的基础模型上直接应用强化学习,让模型学会了自我反思和深度推理,在视觉推理任务上取得了显著突破。研究还发现指令微调可能限制模型的推理能力发展,为AI训练方法提供了新的思路。
    至顶网  科技行者  2025-08-01 10:15:14  
  • 清华大学团队重磅发布:一个AI模型既会画画又会"思考"图片,颠覆传统人工智能设计

    清华、浙大等高校联合研发MergeVQ框架,首次实现单一AI模型同时精通图像理解与生成。通过创新的信息分层处理和Token合并技术,该系统用传统方法五分之一的计算资源达到更优性能,在ImageNet测试中展现突出效果。这一突破为AI视觉技术的高效化和普及化开辟新路径,有望推动智能相册、内容创作、电商推荐等多领域应用发展。
    至顶网  科技行者  2025-07-17 09:23:27  
  • 让AI变身"推理专家":大连理工大学团队首创MoR方法,让机器像人类一样自主选择思考策略

    大连理工大学和浙江大学研究团队提出MoR(Mixture of Reasoning)方法,通过将多种推理策略嵌入AI模型参数中,让AI能自主选择最适合的思考方式,无需人工设计专门提示词。该方法包含思维生成和数据集构建两阶段,实验显示MoR150模型性能显著提升,比基线模型提高2.2%-13.5%,为AI推理能力发展开辟新路径。
    至顶网  科技行者  2025-07-03 16:59:05  
  • 普通人也能训练顶级AI模型:斯坦福大学揭秘让算力暴增640倍的神奇方法

    斯坦福大学研究团队开发出名为"投机采样"的AI训练新方法,通过引入小型草稿模型提供候选方案,让主模型无需从零开始计算,训练速度提升2-640倍,同时将能源消耗降低80%以上。这项技术大幅降低了AI模型训练成本,让普通人和小团队也能负担得起高质量AI模型开发,有望推动AI技术民主化普及。
    至顶网  科技行者  2025-09-28 13:47:41  
  • EXAONE 4.0:LG AI Research让AI能动能静,一个模型搞定快速回答和深度思考

    LG AI Research发布EXAONE 4.0大型语言模型,创新性地在单一模型中集成了快速回答和深度思考两种模式。该模型支持英语、韩语、西班牙语三种语言,具备智能工具使用能力,能处理12.8万字长文本,在数学推理和编程能力方面表现出色,甚至超越了许多更大规模的模型,为AI技术的实用化发展提供了新的解决方案。
    至顶网  科技行者  2025-07-22 13:21:43  
  • ENERVERSE-AC:通过动作条件打造身临其境的机器人仿真环境

    ENERVERSE-AC(EVAC)是一种创新的动作条件世界模型,它能根据机器人预测的动作生成未来视觉观察结果,实现真实且可控的机器人仿真。该研究由AgiBot、上海交通大学和香港中文大学的研究团队开发,通过多层动作条件注入机制和射线图编码技术,支持动态多视角图像生成。EVAC不仅作为数据引擎可增强训练数据多样性,还能作为政策评估器模拟环境响应,无需物理机器人即可进行政策测试,显著降低了开发成本。实验结果表明,EVAC生成的仿真与真实世界场景高度一致,为机器人模仿学习提供了高效、经济的解决方案。
    至顶网  科技行者  2025-05-19 14:59:48  
  • 蚂蚁集团推出UI-Venus:让AI也能像人一样"看懂"并操作电脑界面

    蚂蚁集团推出UI-Venus系统,这是一个能够仅通过屏幕截图就理解和操作用户界面的AI模型。该系统采用强化微调技术,在多个基准测试中达到业界最佳水平,其72B版本在界面识别任务上准确率达95.3%,在复杂的安卓操作任务中成功率达65.9%。研究团队还开发了创新的自进化轨迹对齐技术,显著提升了AI在多步骤任务中的规划能力,为智能化人机交互开辟了新途径。
    至顶网  科技行者  2025-08-19 10:18:56  
  • 香港大学团队推出MangaNinja:让线条画自动变彩图的AI绘画助手

    MangaNinja是香港大学团队开发的AI线条画上色系统,能够根据参考图自动为黑白线条画精确上色。该系统采用双分支架构和渐进式补丁打乱训练策略,即使参考图与线条画姿势差异很大也能准确匹配。用户可通过点控制功能实现精细调节,支持多参考图融合和跨角色创意上色。在综合测试中表现优异,为动画制作和数字艺术创作提供了强大工具。
    至顶网  科技行者  2025-09-17 13:32:09  
  • OriginAI团队:用文本训练就能让AI看懂视频?这个"偷懒"的方法竟然超越了传统巨头

    这项由以色列OriginAI公司发表的研究颠覆了传统视频AI训练思路,仅用6万个文本对就实现了超越数亿视频数据训练的效果。研究发现AI模型中间层隐藏着丰富的视频理解能力,通过巧妙提取和文字优化就能激发这些潜能,为高效视频搜索技术开辟了全新路径,预示着轻量级AI时代的到来。
    至顶网  科技行者  2026-02-13 08:31:16  
  • 希腊国立雅典理工大学突破音乐AI偏见:让机器真正听懂全世界的音乐

    希腊雅典理工大学团队开发CultureMERT-95M多文化音乐AI模型,通过两阶段持续预训练和任务算术方法,让AI系统学会理解希腊、土耳其、印度等非西方音乐传统。该模型在非西方音乐分类任务上提升4.9%准确率,同时保持西方音乐理解能力,为构建更包容的全球音乐AI系统奠定基础。
    至顶网  科技行者  2025-06-27 09:35:11  
  • 法国团队打造"推理核心":让AI像数学家一样思考的训练场

    法国研究团队开发了"推理核心"训练环境,专门培养AI的基础推理能力。该系统包含18个核心任务,涵盖逻辑推理、规划、因果分析等领域,能无限生成新题目并精确控制难度。与传统依赖固定题库的方法不同,推理核心专注于培养通用认知能力,并使用专业工具验证答案。GPT-5测试显示任务具有挑战性,为AI推理能力发展开辟新路径。
    至顶网  科技行者  2025-10-09 10:14:03  
  • ViStoryBench:一场可视化故事世界的大冒险——StepFun团队打造全面评估标准,帮你判断AI是否真懂讲故事

    ViStoryBench是一个全面的故事可视化评估基准,由StepFun团队打造,用于测试AI将文字故事转化为连贯图像序列的能力。它包含80个多样化故事和344个角色参考,评估包括角色一致性、提示遵循度等多个维度。研究测试了20多种方法,发现UNO在开源方法中表现最佳,而商业软件如豆包和GPT-4o在提示一致性方面表现突出。该基准为故事可视化研究提供了统一标准,推动这一领域的创新发展。
    至顶网  科技行者  2025-07-07 17:38:18  
  • Roblox公司让AI实时翻译说话变成可能:语音边听边翻译的突破性技术

    Roblox公司开发出REINA技术,实现语音边听边翻译的突破。该技术基于信息论原理,通过智能判断何时获得足够信息来决定翻译时机,避免传统方法需要等待完整句子的延迟问题。在13万小时开源数据训练下,REINA在多语言实时翻译任务中相比现有方法提升21%,为跨语言实时交流带来新突破。
    至顶网  科技行者  2025-08-12 14:16:18  
  • 阿里巴巴推出GSPO:让AI大模型训练不再"崩盘"的革命性算法

    阿里巴巴通义千问团队推出GSPO算法,解决了大型语言模型强化学习训练中的稳定性问题。该算法改变传统逐词优化方式,采用序列级重要性权重和截断机制,显著提高训练效率和稳定性,特别适用于专家混合模型训练,已成功应用于Qwen3模型并取得显著性能提升。
    至顶网  科技行者  2025-07-29 17:15:41  
  • 巴西圣保罗1400万新生儿数据揭示:AI预测婴儿死亡准确率达99%

    这项国际合作研究基于巴西圣保罗1400万新生儿数据,运用7种AI算法预测新生儿28天内死亡风险。研究发现LSTM深度学习算法预测准确率高达99%,远超传统机器学习方法的94%。该技术能帮助医生提前识别高危婴儿并采取预防措施,对改善全球新生儿健康状况具有重要意义,特别适用于医疗资源匮乏地区。
    至顶网  科技行者  2025-06-26 10:14:13  
  • MPS-Prover:多视角搜索和数据精选让自动定理证明更上一层楼

    腾讯AI实验室和腾讯LLM部门研究人员开发的MPS-Prover是一种创新的逐步自动定理证明系统,通过两大关键创新解决了现有方法的局限:一个高效的训练后数据精选策略,剔除约40%冗余训练数据;以及一个多视角树搜索机制,整合了学习型评价模型与策略性设计的启发式规则,提高策略选择多样性并增强搜索稳健性。实验表明,MPS-Prover在miniF2F和ProofNet等基准测试上实现了最先进性能,生成的证明比现有方法更简洁多样,为开发更强大的混合证明系统提供了宝贵思路。
    至顶网  科技行者  2025-05-21 13:35:23  
  • 清华大学和微软亚研院联手破解AI训练密码:如何让机器像人一样边学边忘记

    这项由清华大学和微软亚洲研究院合作完成的研究,通过创新的动态知识蒸馏和选择性遗忘机制,成功解决了AI系统在学习新任务时会遗忘旧知识的"灾难性遗忘"问题。该技术让AI能够像人类一样进行终身学习,在掌握新技能的同时保持对已有能力的熟练程度,为智能手机助手、自动驾驶、医疗AI等领域的应用带来重大突破,推动AI从静态工具向智能伙伴的转变。
    至顶网  科技行者  2025-09-18 10:25:28  
  • 南开大学团队推出DepthAnything-AC:让AI在恶劣天气中也能精准"看懂"距离

    南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。
    至顶网  科技行者  2025-07-04 10:32:53  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号