用了 0.052387秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容1228 条
  • 港科大推出LazyDrag:一招搞定图片编辑难题,不用训练就能让照片"听话"

    港科大研究团队开发的LazyDrag系统创新性地解决了图片拖拽编辑中的核心难题。该系统摒弃传统的隐式匹配方法,采用显式对应地图技术,实现了无需训练的高精度图片编辑。LazyDrag支持文字引导功能,能智能理解用户意图,在准确性和感知质量方面全面超越现有方法,为AI辅助图片编辑开辟了新方向。
    至顶网  科技行者  2025-09-28 11:00:01  
  • 机器人不再需要"内感觉"?上海交通大学团队发现视觉就够了

    上海交通大学研究团队发现,机器人仅依靠视觉就能完成复杂操作任务,无需传统的"内感觉"信息。这种"无状态"控制方法在环境变化时表现更好:高度变化测试中成功率从0%提升至85%,水平变化测试中从6%提升至64%。研究还显示该方法具有更高的数据效率和跨平台适应能力,为未来机器人技术发展开辟了新路径。
    至顶网  科技行者  2025-10-14 12:09:38  
  • Mistral AI首次推出推理模型Magistral:纯强化学习训练让AI学会"深度思考"

    Mistral AI首次推出推理模型Magistral,采用纯强化学习训练让AI学会深度思考。该模型在数学推理能力上提升近50%,能够展示完整思考过程,并意外获得多模态推理能力提升。研究团队开源了Magistral Small模型,为AI推理能力发展开辟新路径,证明了强化学习在培养AI思维能力方面的巨大潜力。
    至顶网  科技行者  2025-06-18 09:20:58  
  • 阿里达摩院推出VideoLLaMA3:让AI同时"看懂"图像和视频的革命性突破

    阿里达摩院发布VideoLLaMA3,这是首个采用"以视觉为中心"设计的多模态AI模型,能够同时理解图像和视频内容。该模型通过四阶段训练和任意分辨率视觉标记化等创新技术,在多项图像和视频理解基准测试中取得突破性成绩,特别是在数学推理方面提升显著。VideoLLaMA3为教育、医疗、内容创作等领域提供了强大的视觉理解能力。
    至顶网  科技行者  2025-09-18 11:11:20  
  • 让AI学会"团队协作":伊利诺伊大学团队开发出让多个AI模型协同工作的智能调度系统

    伊利诺伊大学香槟分校研究团队开发了Router-R1,一个能让多个AI模型像团队一样协作的智能调度系统。该系统通过强化学习,学会在"思考"和"调用专家"之间灵活切换,能根据任务复杂度动态协调不同AI模型,同时平衡性能与成本。在七个问答数据集的测试中,Router-R1显著超越现有方法,平均准确率提升约20%,并展现出对未见过模型的强泛化能力。
    至顶网  科技行者  2025-06-24 13:46:54  
  • 大语言模型为什么总是"学会"错误的东西?浙江大学研究团队找到了让AI更聪明的全新方法

    浙江大学研究团队开发了CAT方法,通过在大语言模型的注意力机制中注入因果知识,解决AI容易学习虚假关联而非真正因果关系的问题。实验显示该方法显著提升了模型在新环境下的表现,如Llama模型准确率从64.5%提升至90.5%。这项创新为开发更可靠、具备真正推理能力的AI系统提供了新思路。
    至顶网  科技行者  2025-09-26 12:21:19  
  • 机器人学会自己进步:上海AI实验室让机器人在真实世界中像人类一样从错误中学习

    上海AI实验室开发的VLAC模型让机器人首次具备真实世界自主学习能力。该系统如同给机器人配备智能导师,能实时评估动作效果并从中学习。在四个操作任务测试中,机器人成功率从30%提升至90%,仅需200次练习。技术结合视觉、语言理解和动作生成,支持跨场景适应和人机协作,为家庭服务、医疗护理等领域应用奠定基础。
    至顶网  科技行者  2025-10-09 12:21:19  
  • 年底了,你攒了多少钱?

    「 2022年你攒到钱了吗?随着春节临近,这个话题下有人欢喜有人愁。今日推荐 燃次元( ID :chaintruth ) 一篇文章,人们手上的钱就是众生百态的缩影。」
    至顶网  至顶网码客人生频道  2023-01-28 09:19:20  
  • 宾夕法尼亚大学团队让AI不再违背物理定律:一张照片就能生成符合真实物理规律的视频

    宾夕法尼亚大学研究团队开发了PhysCtrl系统,能从单张照片生成符合真实物理定律的视频。该系统通过学习55万个物理仿真数据,结合空间-时间注意力机制和物理约束,准确预测不同材质物体在外力作用下的运动轨迹,解决了传统AI视频生成中物理不合理的问题,在多项评估中显著优于现有方法。
    至顶网  科技行者  2025-10-15 08:06:01  
  • 微软研究团队揭秘:AI推理模型为什么会在"多步思考"时犯糊涂?

    微软和马萨诸塞大学研究团队通过系统分析六种AI模型在多跳推理任务中的表现,发现了AI推理中的普遍问题:过度跳跃、推理保真度随复杂性下降、以及正确答案与错误推理过程脱钩现象。研究建立了七种推理错误分类体系,并开发了自动化评估框架,为改进AI推理能力和构建可靠AI系统提供了重要指导。
    至顶网  科技行者  2025-08-12 14:17:28  
  • Lightricks团队打造视频生成新利器:2秒生成5秒视频的LTX-Video模型

    LTX-Video是由以色列Lightricks公司开发的革命性开源视频生成模型,能够在2秒内生成5秒高质量视频,实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程,采用1:192的超高压缩比和共享去噪机制,在人类评估中表现显著优于同类模型。作为完全开源的项目,它为教育、营销、内容创作等多个领域提供了强大而accessible的视频生成能力。
    至顶网  科技行者  2025-09-16 11:09:43  
  • 微软发布Phi-4-Mini-Reasoning:3.8B参数的"小钢炮"在数学推理上击败8B大模型

    微软推出的Phi-4-Mini-Reasoning模型仅用38亿参数就在数学推理任务上击败了70-80亿参数的竞争对手。通过创新的四阶段训练方法(大规模中期训练、监督精调、回滚偏好学习、强化学习),该模型在AIME24、MATH-500等测试中表现卓越。这项研究证明了"精巧胜于庞大"的AI设计理念,为资源受限环境下的高性能AI应用开辟了新路径,在教育、科研等领域具有广阔应用前景。
    至顶网  科技行者  2025-07-10 15:42:17  
  • AI绘画界的"反作弊神器":清华大学团队推出T-LoRA技术,让AI不再"背答案"

    清华大学团队推出T-LoRA技术,解决AI绘画中的"背答案"问题。该技术通过时间步骤的智能控制和正交初始化,让AI在学习单张照片时既保持特征准确性,又避免过度记忆背景等细节,生成更有创意和多样性的图像。实验显示T-LoRA在文本对齐度方面比传统方法提升约10%,为AI创意产业开辟新可能性。
    至顶网  科技行者  2025-07-21 09:12:37  
  • 滑铁卢大学科学家发明神奇AI:仅凭声音就能生成开口说话的逼真视频

    这项研究展示了一种革命性的AI技术,能够仅通过音频生成高度逼真的说话视频。滑铁卢大学研究团队开发的Audio2Photoreal系统巧妙结合了深度学习、扩散模型等先进技术,实现了声音到面部动作的精准转换。该技术在影视制作、在线教育、新闻媒体等领域具有广阔应用前景,将大幅降低视频制作成本和门槛。虽然仍面临计算资源需求高、隐私安全等挑战,但其突破性创新为未来视频内容创作开辟了全新路径。
    至顶网  科技行者  2025-08-27 10:31:20  
  • Google DeepMind推出Gemma 3:轻量级多模态AI模型的革命性突破

    Google DeepMind发布Gemma 3多模态AI模型家族,参数量从1B到27B,支持文字、图片理解和多语言处理,可在普通设备运行。创新的5:1注意力架构将内存消耗降低75%,支持128K长文档处理。在多项测试中表现优异,27B版本在聊天机器人竞技场排名第9,超越了许多更大规模的模型,实现了AI技术的真正民主化。
    至顶网  科技行者  2025-08-01 10:13:44  
  • ByteDance推出Seedream 4.0:AI图像生成的新纪元,一秒生成4K图片的超级引擎

    字节跳动发布Seedream 4.0多模态图像生成系统,实现超10倍速度提升,1.4秒可生成2K高清图片。该系统采用创新的扩散变换器架构,统一支持文字生成图像、图像编辑和多图合成功能,在两大国际竞技场排行榜均获第一名,支持4K分辨率输出,已集成至豆包、剪映等平台,为内容创作带来革命性突破。
    至顶网  科技行者  2025-10-15 14:21:54  
  • 斯科尔科沃科技学院新发现:用"透视镜"揭开AI文本的真面目

    斯科尔科沃科技学院团队开发了一种基于稀疏自编码器的AI文本检测新方法,能够像"透视镜"一样看穿文本表面,识别AI生成内容的内在特征。研究发现AI文本具有三大类特征:话语特征、噪声特征和风格特征,不同AI模型表现出独特的"写作个性"。这种方法不仅检测准确率高,还能解释检测原理,为教育、媒体等领域提供了更可靠的AI内容识别工具。
    至顶网  科技行者  2025-08-04 13:32:52  
  • 上海AI实验室推出超级评委AI:让机器像人类专家一样评判文本质量

    上海AI实验室推出CompassJudger-2,这是一个能够像人类专家一样评判文本质量的AI模型。通过创新的批判性思考训练方法和高质量数据处理,这个7B参数的模型在多个评估基准中超越了更大规模的竞争对手,展现出专业化训练的威力。
    至顶网  科技行者  2025-07-22 09:23:26  
  • 从一个工具到多个专家助手:字节跳动和浙江大学团队如何让AI创作图文内容变得"身怀绝技"

    这项由浙江大学和字节跳动联合完成的研究提出了LLM-Interleaved(LLM-I)框架,突破了现有AI图文创作系统的"单工具"瓶颈。该系统让大语言模型充当智能指挥官,根据需求调用在线搜索、图像生成、代码执行、图像编辑四种专业工具。通过创新的三重强化学习奖励机制训练,LLM-I在四个基准测试中均取得显著超越现有方法的表现,特别是在自建的LLMI-Bench基准上比GPT-4o高出25个百分点,工具调用成功率达到100%。
    至顶网  科技行者  2025-09-30 10:50:59  
  • 韩国KAIST团队首次解决文字图像修复难题,让老照片上的模糊文字重获新生

    韩国KAIST团队首次提出文字感知图像修复技术,解决了传统图像修复无法准确恢复文字内容的难题。研究构建了包含10万张图像的SA-Text数据集,开发了TeReDiff模型,通过三阶段训练和智能提示机制,实现图像修复与文字识别的协同工作。实验显示该技术在文字识别准确率上比传统方法提升15-20%,为历史文献保护、档案数字化等领域提供了重要解决方案。
    至顶网  科技行者  2025-06-17 13:13:40  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号