用了 0.048723秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容3164 条
  • SkyReels-Audio:让肖像"动"起来 - Skywork AI开创全能音频驱动的人像视频生成技术

    SkyReels-Audio是Skywork AI团队开发的全能音频驱动人像视频生成框架,能将静态图像或视频与语音输入结合,生成高度逼真、唇形同步的说话人像视频。基于预训练的视频扩散变换器构建,该技术支持无限长度视频生成和编辑,提供多模态控制能力。通过混合课程学习策略和双向潜在融合技术,该模型在身份一致性、面部表情自然度和唇形同步精度上取得了突破性进展,为数字内容创作、教育和娱乐领域带来革命性可能。
    至顶网  科技行者  2025-06-11 07:51:43  
  • 汽摩行业的C2M,离不开高效且柔性的供应链

    100多年前,当“汽车之父”戴姆勒骑着世界上第一台摩托车亮相休塔特广场时,他或许不会想到,自己发明的这个代步工具,如今会成为成千上万另类玩家和文艺青年们追求生活品质的一种奢侈品。
    至顶网  高玉娴  2020-12-09 15:14:51  
  • 让语言模型思考更聪明:通过强化学习实现混合隐式推理

    这项研究提出了一种名为混合推理策略优化(HRPO)的新方法,通过强化学习使大型语言模型能够结合离散标记和连续隐藏表示进行推理。HRPO设计了创新的门控机制,初始时以标记嵌入为主,逐渐增加隐藏状态的比例,并通过强化学习优化这一混合策略。实验表明,HRPO在知识和推理任务上显著优于现有方法,甚至使小型模型达到大型模型的性能,同时展现出跨语言推理等有趣特性。
    至顶网  科技行者  2025-05-30 14:40:24  
  • 跨越“Prompt”浅滩,航向“Context”深海

    在“PEC 2025 AI创新者大会暨第二届提示工程峰会”的“从提示工程到上下文工程 AI落地范式升级”分论坛上,多位一线实践者与意见领袖,就如何构建高效上下文、激活企业级Agent、赋能个体创造等核心议题,展开了深度剖析。
    至顶网  毛烁  2025-09-16 19:09:46  
  • BOE(京东方)携尖端创新技术亮相2023国际显示周 引领半导体显示行业发展风向标

    美国时间5月23日,被誉为显示界“奥斯卡”的国际显示周(SID Display Week2023)在美国洛杉矶隆重启幕。
    至顶网  业界供稿  2023-05-25 15:49:45  
  • “黄氏定律”助力AI性能实现逐年翻倍 NVIDIA加速赋能中国行业客户业务创新

    以上一系列举措,其实只是NVIDIA赋能中国各行各业创新的“冰山一角”。随着中国“新基建”的推出,5G、AI等新技术不断与行业深入融合,NVIDIA依靠黄氏定律实现AI性能实现逐年翻倍,更好地满足行业的智能应用需求。
    至顶网  李祥敬  2020-12-15 15:15:52  
  • 大模型能否欺骗CLIP?通过文本更新测试预训练多模态表示的对抗组合能力

    首尔国立大学研究团队提出了"多模态对抗组合性"(MAC)基准测试,评估预训练多模态表示(如CLIP)在理解文本与图像、视频、音频关系时的组合性弱点。研究使用大语言模型生成欺骗性文本,通过样本成功率和多样性双重指标进行评估。团队创新性地提出了多样性促进自训练方法,即使使用较小的Llama-3.1-8B模型,也能显著提高攻击成功率和多样性。实验在COCO、MSRVTT和AudioCaps数据集上验证,该方法优于现有技术,并展示了良好的跨模型迁移性,为构建更可靠的多模态系统提供了重要见解。
    至顶网  科技行者  2025-06-03 13:45:40  
  • 告别苏州撸代码的日子,回内蒙大草原卖羊粪

    小城市的人不理解我,嘲笑我是‘大粪厂长‘,但我大城市的朋友们不一样,他们说如果你能把屎卖出去,那很厉害。
    至顶网  尼酱  2023-07-18 10:05:37  
  • 西安交通大学与蚂蚁集团联合发布:AI如何真正理解人类情感并给出贴心回应

    西安交通大学与蚂蚁集团联合发布HumanSense研究,首次建立了AI情感智能的系统性评估框架。通过3882道真实场景测试题,研究发现当前最先进AI在人际互动理解方面仍有巨大提升空间,人类得分87.5%而AI仅57.8%。研究团队通过多阶段强化学习训练,成功提升了AI的多模态推理能力,让AI学会像心理咨询师一样观察、理解和回应人类情感,为开发更具共情能力的AI系统奠定了重要基础。
    至顶网  科技行者  2025-08-19 10:18:43  
  • 供应链数智化再提速,神州控股科捷渐入佳境

    神州控股(00861.HK)旗下的北京科捷物流有限公司(以下简称“科捷”),在2019年双十一再次创下业内单仓300万单的新纪录。在所有智能仓储物流企业中,科捷扮演着领导者角色。
    至顶网  业界供稿  2019-12-13 08:45:12  
  • 博世的数字孪生策略

    博世数字孪生高级专家Birgit Boss博士具体解释了汽车行业内的各个领域将如何从数字孪生中获益。
    至顶网  至顶网软件与服务频道  2023-11-13 09:31:33  
  • 多台无人机不用对话也能抬重物?代尔夫特理工大学用AI让空中搬运变得聪明又安全

    代尔夫特理工大学研究团队首次实现了完全分布式的多无人机协作搬运系统,通过多智能体强化学习让三台无人机在无需相互通信的情况下精确控制悬挂重物的6自由度姿态。该方法仅通过观察被搬运物体状态实现隐性协作,计算效率比传统集中式方法提升13倍,并展现出优异的容错能力。
    至顶网  科技行者  2025-08-18 13:57:29  
  • 剑桥大学发布突破性研究:让AI学会从人类行为中"看穿"真实意图的新方法

    剑桥大学研究团队发布突破性研究,提出通过逆强化学习让AI从人类行为中推断真实意图的新方法。该方法解决了大语言模型训练中的关键挑战,包括缺乏明确奖励信号、计算资源需求巨大等问题。通过观察人类偏好数据而非直接指令,AI能更好地理解复杂的人类价值观,在对话、数学推理等领域表现显著提升。
    至顶网  科技行者  2025-07-24 16:26:01  
  • 自由飞翔的3D高斯:浙大研究团队打造高效动态场景重建新方法

    浙江大学和吉利汽车研究院联合团队提出的FreeTimeGS是一种创新的动态3D场景重建方法。不同于传统方法,它允许高斯基元在任意时空位置自由出现,并赋予每个基元运动功能,使其能够随时间移动到相邻区域。研究通过4D正则化策略解决了高不透明度基元阻碍优化的问题。在多个数据集测试中,该方法在渲染质量和速度上均大幅超越现有技术,特别是在处理复杂动态场景时,使用单个RTX 4090 GPU能以467 FPS的速度实现1080p实时渲染,为电影制作、游戏和虚拟现实等应用提供了新可能。
    至顶网  科技行者  2025-06-09 16:58:44  
  • 香港科技大学团队让电脑听音识画面:仅凭声音就能生成逼真视频

    香港科技大学研究团队开发出SpA2V框架,这是首个能够从音频中提取空间信息并生成对应视频的AI系统。该技术不仅能识别声音类型,还能准确判断声源位置、移动方向和距离,通过两阶段生成过程实现"听音生画"。实验结果显示SpA2V在空间对应性和视频质量方面显著超越现有方法,为音频可视化、影视制作、教育应用等领域开辟了新的可能性。
    至顶网  科技行者  2025-08-07 10:21:55  
  • 太阳队争夺NBA总冠军的“神秘球员”——5G

    在处理球员数据、寻求成绩提升方法的过程中,无线技术为太阳队带来了强大的竞争优势。
    至顶网  科技行者  2021-08-20 16:27:51  
  • 小冰“森林”初长成

    小冰已经诞生八年,代级进入第九代,身影遍布各行各业。
    至顶网  高玉娴  2022-04-11 18:09:50  
  • 600万人都用过的云一朵,究竟如何让记忆更高效?

    在9月5日举办的2023百度云智大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖表示,百度网盘“云一朵”智能助理面向大众全面开放使用
    至顶网  业界供稿  2023-09-07 16:40:08  
  • 用在线强化学习进化图像生成技术:Flow-GRPO如何让AI更精准地理解你的需求

    想象一下,你对AI说:"给我画四个杯子",结果AI只画了三个,或者你要求"一只红狗",却得到了一只棕色的狗。这些"听不懂人话"的情况在当今最先进的文生图AI中仍然很常见。虽然目前的AI生成技术已经能创造出令人惊叹的图像,但在准确理解和执行具体指令方面,它们还存在明显的短板。
    至顶网  科技行者  2025-05-12 12:44:38  
  • 一次攻击,让300多人失业......

    最近半年,一场猝不及防的疫情席卷了全球,众多企业在仓促之下,不得不加快远程办公或远程运维项目的上线,以尽快恢复业务。
    至顶网  戴尔  2020-06-10 16:24:43  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号