用了 0.124798秒,为您找到mg 性价比 最高 高达 網纸 YB233相关内容9827 条
  • 下一步视频推理:新加坡国立大学团队通过预测下一事件改进视频理解

    这项研究提出了"下一事件预测"作为培养视频AI时间推理能力的新方法。研究者将视频分为过去和未来部分,让AI预测未来事件,而不仅仅是描述所见。他们创建了V1-33K数据集(包含33,000个视频片段)和FutureBench测试基准,实验证明这种方法显著提升了模型的时间推理能力。研究发现,演绎推理(通过下一事件预测)比归纳推理(视频问答)和溯因推理(先前事件预测)更有效,简单的监督式微调就能取得良好效果,且增加数据量超过5K后效果提升不明显。
    至顶网  科技行者  2025-06-03 07:42:38  
  • 北京大学重磅推出Lumen:让视频重新打光变得像换背景一样简单

    北京大学团队推出革命性AI系统Lumen,通过创新的多域联合训练策略解决视频重打光难题。系统结合3D渲染数据的物理准确性和真实视频的自然质感,实现端到端的智能视频重打光。用户只需输入视频和文字描述,即可获得专业级光影效果,在多项评估指标上全面超越现有方法,为视频制作技术的普及化开辟新路径。
    至顶网  科技行者  2025-08-26 14:12:25  
  • 中国黑客关系图

    「 天下风云出我辈,一入江湖岁月催。皇图霸业谈笑中,不胜人生一场醉。今日推荐 雷锋网(id:leiphone-sz)一篇文章。袁哥、沈继业、冰河、杨冀龙、杨勇、方兴、江海客、季昕华、黑哥……致敬网安领域的时代先驱们。」
    至顶网  至顶网码客人生频道  2022-09-26 11:43:02  
  • 智元机器人如何跨越“莫拉维克鸿沟”?

    邓泰华判断,具身智能的市场空间可能是:“智能手机的数量乘以单车的价格”。
    至顶网  高飞  2025-09-05 14:38:12  
  • 快手科技团队推出Klear-Reasoner:让AI像人类一样深度思考的革命性突破

    快手科技团队开发的Klear-Reasoner在AI推理领域取得重大突破,在数学竞赛AIME2024中获得90.5%高分。该研究完全公开训练细节,提出创新的GPPO方法解决传统强化学习局限,证明精选高质量数据比大量普通数据更有效,为AI推理能力提升提供了新的技术路径。
    至顶网  科技行者  2025-08-14 12:12:34  
  • 生命长久安全对齐:让大语言模型持续抵御不断进化的越狱攻击

    这项研究提出了一种创新的"生命长久安全对齐"框架,使大语言模型能够持续适应不断进化的越狱攻击策略。框架核心是元攻击者与防御者之间的对抗演化循环:元攻击者不断发现新的攻击策略,防御者则学习抵御这些攻击。实验表明,经过两轮迭代后,防御者成功将攻击成功率从73%降至7%,同时保持了模型的有用性。这种动态进化方法相比传统静态安全对齐更有效,为构建持续安全的大语言模型提供了新方向。
    至顶网  科技行者  2025-05-30 07:44:18  
  • 2023CSDI算力+智能:数字时代的进化升级

    在未来的产业布局中,云网融合、软硬一体化,硬件智能化、软件的泛化以及数据无处不在,基本是未来的趋势。
    至顶网  业界供稿  2023-05-18 21:43:02  
  • 清华大学突破性研究:让AI像人眼一样实时"看懂"动态世界

    清华大学团队开发的StreamVGGT实现了首个实时4D视觉几何重建系统,通过模仿人类视觉的时间因果感知机制,将处理速度提升30倍而精度几乎不变。该技术采用流式处理架构和知识蒸馏训练,为自动驾驶、AR/VR、机器人导航等领域提供了突破性解决方案。
    至顶网  科技行者  2025-07-25 09:36:49  
  • 博洛尼亚大学AI团队巧用情感分析,让AI更精准识别新闻中的主观表达

    博洛尼亚大学团队开发出情感增强的AI系统,通过结合情感分析和文本分类技术,显著提升了新闻文章中主观性表达的识别准确率。该研究覆盖五种语言,在多项国际评测中取得优异成绩,为打击虚假信息和提升媒体素养提供了新工具。
    至顶网  科技行者  2025-07-23 10:46:14  
  • 哈佛大学团队揭秘:如何用"心理学+AI"的神奇组合,让机器人学会像人类一样从错误中成长

    哈佛大学研究团队开发出革命性AI训练方法,让机器能像人类一样从错误中学习成长。与传统需要大量正确答案示例的方法不同,新方法让AI系统自主探索并从失败中提取学习信号。实验显示,这种方法在机器人导航、医学诊断等领域表现出更强适应性和创新能力,所需训练数据减少70%,面对新情况时性能更稳定,为AI教育应用和科学研究开辟了新前景。
    至顶网  科技行者  2025-07-07 17:30:39  
  • 视觉赋能大脑:让多模态大语言模型在真实空间中看见、思考与控制

    这项由上海人工智能实验室等机构联合发布的研究提出了VeBrain框架,成功解决了多模态大语言模型在现实世界应用中的关键挑战。VeBrain通过将机器人控制重新定义为2D视觉空间中的文本任务,统一了多模态理解、视觉空间推理和物理控制三大能力。研究团队还创建了包含60万条高质量指令数据的VeBrain-600k数据集,并设计了创新的机器人适配器将模型决策转化为实际运动。实验结果表明,VeBrain在13个多模态基准和5个空间智能基准上表现优异,并在实际机器人应用中展示出强大的适应性和组合能力。
    至顶网  科技行者  2025-06-06 17:29:14  
  • 让AI看图说话更详细更准确:上海人工智能实验室团队开发的ScaleCap技术突破

    这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。
    至顶网  科技行者  2025-06-27 17:00:35  
  • 机器人学习新突破:华为诺亚实验室推出Python编程框架Ark,让机器人像玩乐高一样简单

    华为诺亚实验室联合多家顶尖院校推出开源机器人编程框架Ark,通过Python优先设计和模块化架构,实现仿真与现实环境的无缝切换。该框架大幅降低机器人编程门槛,支持现代AI技术集成,为机器人学习研究提供统一平台,有望加速机器人技术普及。
    至顶网  科技行者  2025-07-02 09:10:12  
  • 巴斯克大学开发出医疗图像分析新武器:AI医生只需15步就能精准识别皮肤病变

    西班牙巴斯克大学开发的SegDT是首个将扩散变压器技术应用于医疗图像分割的AI系统,专门用于皮肤病变识别。该系统创新性地融合了修正流技术,将传统35步推理过程压缩至15步,在保持94%以上准确率的同时大幅提升效率。SegDT仅需990万参数即可在普通GPU上运行,为资源受限的医疗机构提供了专业级诊断支持,有望推动医疗AI的广泛普及应用。
    至顶网  科技行者  2025-07-29 12:01:23  
  • AI终于学会了记忆:南洋理工大学团队让虚拟世界永不遗忘的突破性进展

    南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
    至顶网  科技行者  2025-07-11 15:23:52  
  • 微软推出RealPlay:用AI把游戏世界变成现实世界的神奇技术

    微软等机构联合推出的RealPlay系统首次实现了用游戏控制指令生成现实视频的突破。该系统仅使用赛车游戏数据训练,却能控制现实中的汽车、自行车和行人运动,控制成功率达90%。RealPlay支持交互式视频生成,用户可像玩游戏般逐步指导视频发展,生成质量接近真实拍摄,为AI视频生成和未来游戏引擎开发开辟了新方向。
    至顶网  科技行者  2025-06-27 10:27:10  
  • ACTalker:香港科技大学团队打造会表情的AI主播,让视频通话变得更自然

    香港科技大学团队开发的ACTalker系统实现了多信号协同控制的说话头像生成突破,通过并行控制曼巴层和面具丢弃策略,让AI能同时根据音频和面部动作生成自然的说话视频,在语音同步性和表情控制精度方面全面超越现有方法,为虚拟交互应用开辟了新的可能性。
    至顶网  科技行者  2025-07-15 10:08:03  
  • 技术界的新突破:以色列理工学院研究团队让AI模型学会"思维延续"的神奇技能

    以色列理工学院研究团队开发出一种新颖的AI推理改进方法,通过训练专用的"继续思考"标记,让AI模型在解题时能够进行更深入的思考。该方法只需训练单个标记的嵌入向量,保持模型其他参数不变,在数学推理任务中展现出显著效果,准确率提升幅度达到传统方法的三倍以上,为AI推理能力提升提供了高效且通用的解决方案。
    至顶网  科技行者  2025-06-19 12:54:40  
  • 如何让AI像电影配乐师一样创作完整的长篇音频故事——腾讯ARC实验室团队AudioStory突破性进展

    腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
    至顶网  科技行者  2025-09-10 09:47:04  
  • 曾经无话不谈的好朋友,如今怎么见个面都难

    大飞和方平是两家中小企业的IT总监,老乡会上认识之后,两人很快成了朋友,经常在工作之余一起打打球、爬爬山、喝喝酒、看看电影(同漫威“死忠粉”),几乎无话不谈。
    至顶网  至顶网云计算频道  2019-01-02 10:53:13  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号