用了 0.520931秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容1228 条
  • 阿里巴巴发布Omni-Effects:让AI导演掌控电影特效的每一个细节

    阿里巴巴研究团队开发的Omni-Effects系统,通过创新的专家架构和空间感知技术,首次实现了AI系统同时制作多种视觉特效并精确控制其位置的能力。该系统包含55种特效类型,在测试中达到97%的特效生成准确率和88%的空间控制精度,大幅降低了专业特效制作的技术门槛,为影视制作、教育、营销等领域提供了强大的创作工具。
    至顶网  科技行者  2025-10-11 09:58:14  
  • 南洋理工大学揭晓:AI看视频为何总是"错过关键细节"?全新基准测试让机器智能无所遁形

    南洋理工大学研究团队开发了名为"视频思维测试"的新基准,通过1000个精心设计的YouTube短视频揭示了AI视频理解的真实水平。测试发现,即使是最强AI模型GPT-4o的正确率也只有36.6%,远低于人类的84.3%。研究指出AI主要存在时空混淆、世界知识缺失和复杂情节理解困难三大问题,为改进AI视频理解能力指明了方向。
    至顶网  科技行者  2025-07-25 09:37:02  
  • 中科院团队发布"万能评委"BaseReward:彻底解决AI多模态模型的"判官难题"

    中科院团队发布BaseReward多模态奖励模型,通过系统性实验建立了构建高性能多模态奖励模型的完整方法论。该模型采用简洁的两层架构设计,在精心筛选的280万偏好数据上训练,在多个权威基准测试中创下新纪录,准确率提升超过11%。研究还发现纯文本数据能显著提升多模态判断能力的重要现象,为AI对齐技术发展提供了重要指导。
    至顶网  科技行者  2025-10-09 14:33:11  
  • 英伟达突破:让AI看懂几小时长视频的"超级大脑"训练术

    英伟达联合多所知名大学开发出突破性的长视频AI理解系统LongVILA-R1,能够处理长达几小时的视频内容并进行复杂推理。该系统通过5.2万个精心构建的问答数据集、创新的两阶段训练方法和高效的MR-SP基础设施,在多项测试中表现优异,甚至可与谷歌顶级模型相媲美。这项技术在体育分析、教育、医疗、安防等领域具有广阔应用前景。
    至顶网  科技行者  2025-07-19 12:53:26  
  • 任何条件都能变成视频:国立新加坡大学联合快手发布Any2Caption,让AI视频生成更懂你的心思

    这项研究首次提出了"任意条件到文字描述"的视频生成新模式,通过多模态大语言模型将用户的各种创意输入转化为结构化描述,再驱动现有视频生成系统。研究团队构建了包含33.7万实例的大规模数据集,并设计了创新的渐进式训练策略,实现了对图像、人体姿态、摄像机轨迹等多种条件的统一理解,显著提升了视频生成的可控性和质量。
    至顶网  科技行者  2025-07-16 09:59:35  
  • 印度HDFC银行首席数据官探讨企业数据治理的价值

    HDFC银行的企业数据管理负责人和我们讨论了当今数据领导者面临复杂的平衡之术,阐明了如何在不忽视良好数据治理的情况下从数据中获取价值。
    至顶网  至顶网CIO与CTO频道  2023-04-19 10:46:40  
  • 研究发现,生成式人工智能每周可以为营销人员节省 5 个小时!

    营销人员通过使用生成式人工智能节省时间,专注于更有趣的任务。Salesforce调查显示,51%的营销人员使用生成式AI,强调了技能、可信数据和人类监督的重要性。数据量增长迅速,营销人员预计生成式AI将改变他们的角色,提高工作效率。然而,许多人对如何有效和安全地使用这项技术缺乏了解,担心内容准确性、质量和安全风险。
    至顶网  元宇宙探索院  2024-04-15 22:04:25  
  • 人工智能如何揭开200多年前的进化谜题?

    人工智能有助于解决进化研究当中最古老的谜题之一,但同时又给我们带来更多新的困惑。
    至顶网  科技行者  2019-08-29 15:03:28  
  • 视觉感知型RAG:通过强化学习和迭代推理赋能视觉丰富信息理解——来自阿里巴巴通义实验室和中科大的最新研究

    这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
    至顶网  科技行者  2025-06-02 12:22:40  
  • 30分钟到入侵城:快速响应比备份更重要吗?

    研究显示,许多组织在应对网络攻击时反应缓慢,可能需要数小时才能做出响应。然而,专家认为,在检测到威胁后的短短几分钟内就能采取行动至关重要。虽然备份仍然重要,但快速的事件响应对于组织从攻击中恢复可能同样重要。本文探讨了快速响应的重要性,以及组织如何在备份和事件响应之间取得平衡。
    至顶网  The Register  2025-04-08 11:17:36  
  • Mirage颠覆视频制作:Captions公司让AI一句话变身专业导演

    Mirage是由Captions公司开发的革命性AI视频制作平台,用户只需用文字描述创意想法,系统就能自动生成专业水准的短视频内容。该技术基于专门训练的AI模型,深度理解社交媒体视频的节奏和吸引力法则。目前拥有超过10万日活用户和2000万注册用户,每月产生300万个视频。平台提供个人版Captions应用和企业版Mirage Studio,后者支持大规模内容制作和快速A/B测试,正在重新定义数字内容创作的门槛和效率。
    至顶网  科技行者  2025-10-11 09:56:49  
  • AI训练新模式:群体智慧让小型语言模型变得更聪明——Gensyn团队的分布式协作训练突破

    Gensyn团队提出SAPO分布式AI训练方法,让普通设备通过分享学习经验协作训练语言模型。实验显示,采用50%本地和50%外部经验的均衡策略,小型AI模型性能提升94%。该方法避免了传统分布式训练的同步瓶颈,为AI训练民主化开辟新路径。
    至顶网  科技行者  2025-09-25 10:32:03  
  • 当电脑开始像人类一样思考:清华大学科学家如何让AI拥有"第六感"

    清华大学研究团队在NeurIPS 2024上发表的System-2 Attention机制,为AI系统增加了类似人类深度思考的能力。该技术通过两阶段信息处理,让AI能够专注于关键信息而不被干扰因素误导,在复杂推理任务中表现显著提升。这项创新不仅解决了现有AI模型容易被无关信息分散注意力的问题,更为未来AI发展指明了从追求规模向提升思维质量转变的新方向。
    至顶网  科技行者  2025-09-08 10:23:27  
  • 戴尔科技荣获首个艾美奖!

    事实上,影视行业从诞生之初就与技术有着密不可分的联系。因为电影和电视技术的发明,我们迎来了以视觉文化为主导的时代,而且随着技术的进步,从无声到有声、从黑白到彩色,我们看见的画面越来越清晰(如4K)且越来越身临其境(如3D)。
    至顶网  戴尔  2020-02-03 15:22:48  
  • SenseFlow:香港科技大学团队突破性提升大规模文本生成图像模型的高效蒸馏技术

    SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别器提升生成质量。实验表明,SenseFlow能将SD 3.5和FLUX等12B参数级模型成功蒸馏为仅需4步生成的高效版本,同时保持甚至超越原模型在多项指标上的表现,代表了AI图像生成效率提升的重要突破。
    至顶网  科技行者  2025-06-06 09:18:07  
  • 腾讯等研究机构突破性进展:如何让AI模型从简单题目中"造"出更难题目来提升推理能力

    腾讯等机构提出Composition-RL方法,通过将多个简单问题组合成复杂问题来提升大语言模型推理能力。该方法解决了AI训练中"太容易题目"无效的问题,在4B-30B参数模型上获得3-10%性能提升,特别是跨学科组合训练效果显著,为AI训练资源高效利用提供新思路。
    至顶网  科技行者  2026-02-13 21:52:07  
  • 混搭拼图增强与置信度边界加权伪标签:如何让模型在无源数据的情况下更好地适应新环境

    罗切斯特理工学院和美国陆军研究实验室的研究团队开发了一种突破性的无源域适应方法,通过混搭拼图增强技术和置信度-边界加权策略,使AI模型能在没有原始训练数据的情况下适应新环境。该方法在三个主要基准数据集上取得显著成果,特别是在PACS数据集上准确率提升了7.3%,为AI系统在隐私保护、安全限制等现实场景中的应用提供了新解决方案。
    至顶网  科技行者  2025-06-06 11:27:13  
  • 东京大学团队突破视角局限:第一次让机器同时用"我的眼睛"和"他人的眼睛"看世界

    这是首个系统性探索跨视角协作智能的综合性研究,由南京大学、东京大学等顶尖机构联合完成。研究团队首次将"第一人称视角"与"第三人称视角"的协作应用进行了全面梳理,提出了三大技术方向和十三个关键任务,涵盖从智能厨房到手术机器人的八大应用场景。这项突破性工作为人工智能向人类认知迈进提供了重要的技术路径和理论基础。
    至顶网  科技行者  2025-06-10 14:21:14  
  • 阿里巴巴研究团队突破多角色面部动画技术:让照片中的多个人物同时"活"起来

    阿里巴巴集团高德地图团队与北京邮电大学合作开发的FantasyPortrait系统,实现了突破性的多人肖像动画技术。该系统采用隐式表情控制和遮罩交叉注意力机制,能够让静态照片中的多个人物同时展现不同的表情动作,在跨身份重现和多人协调动画方面显著优于现有方法,为影视制作、虚拟通信和游戏娱乐等领域带来革命性突破。
    至顶网  科技行者  2025-07-23 19:04:22  
  • 天池大赛-“云上进化”2022全球AI生物智药大赛圆满落幕

    近日,由阿里云联合NVIDIA、角井生物共同主办的“云上进化”2022全球AI生物智药大赛在深圳圆满落下帷幕。此次大赛旨在推动云计算、人工智能(AI)与生命科学领域的交融与发展,通过使用人工智能技术来解决生物医药领域中的挑战。
    至顶网  业界供稿  2023-03-17 10:23:27  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号