用了 0.051467秒,为您找到bob 手机 在线 網纸 YB233相关内容4517 条
  • 南京大学联合美团发布ScaleEnv框架:让AI智能体自学成才的终极训练场

    这项研究开发了ScaleEnv框架,能够从简单关键词自动构建完整的AI训练环境。通过程序化测试和双阶段构建,确保虚拟环境的真实可靠。实验证明,在此框架训练的AI智能体在跨领域测试中表现显著提升,验证了环境多样性对AI泛化能力的重要作用,为AI训练方法开辟了新方向。
    至顶网  科技行者  2026-02-12 13:32:27  
  • 盘点2018年中国私有云市场:繁荣依旧,向混合云演进

    2018年,行业云发展趋势更为明显,每个行业都逐渐形成了自身行业的云计算落地流程和样板案例,极大的促进了私有云建设的落地。同样私有云模式也正在改变着行业企业的业务模式和发展方式。
    至顶网  至顶网软件频道  2018-12-26 10:48:41  
  • AI终于学会了记忆:南洋理工大学团队让虚拟世界永不遗忘的突破性进展

    南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
    至顶网  科技行者  2025-07-11 15:23:52  
  • 解剖自然图像的秘密:伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"

    这篇研究来自加州大学伯克利分校和谷歌研究院团队,探讨了什么让图像看起来"自然"这一问题。论文提出了一种识别自然图像特征的深度学习方法,通过训练神经网络区分真实照片与人工处理的图像,并能将"不自然"的图像转化为更自然的版本。研究不仅揭示了自然图像在颜色分布、纹理特征和内容语义等方面的规律,还展示了在图像修复、质量提升和伪造检测等领域的潜在应用,为理解人类视觉感知和改进AI图像生成提供了新视角。
    至顶网  科技行者  2025-07-07 17:32:15  
  • 北京大学联合字节跳动推出MoVieS:用一秒钟就能从单镜头视频中生成4D动态场景的神奇技术

    北京大学联合字节跳动推出MoVieS技术,能够从单镜头视频中快速重建4D动态场景。该系统采用"动态溅射像素"概念,统一处理场景外观、几何和运动信息,在一秒内完成传统方法需要数小时的重建任务。技术支持新视角合成、3D点追踪、场景流估计等多种应用,在保持高质量的同时实现数量级的速度提升。
    至顶网  科技行者  2025-07-22 09:23:44  
  • 阿里团队突破多角色动画难题:FantasyPortrait让静态照片开口说话更自然

    阿里团队开发的FantasyPortrait系统突破了传统人像动画的局限,通过隐式表情表示和掩码交叉注意力机制,实现了高质量的单人和多人肖像动画生成,特别在跨身份表情迁移方面表现出色,为视频制作和虚拟交流等领域带来新的技术可能性。
    至顶网  业界供稿  2025-07-22 16:01:53  
  • 创新再升级,办公更智慧 华为MateBook系列多款新品齐发

    全球首款i9 Evo认证笔记本电脑华为MateBook 16s i9版本、华为首款大屏高性能轻巧本华为MateBook D 16、华为MateBook 14、华为MateBook D 14、华为显示器新成员华为MateView SE以及全新华为无线鼠标同台发布。
    至顶网  业界供稿  2022-05-23 21:56:01  
  • 曾经无话不谈的好朋友,如今怎么见个面都难

    大飞和方平是两家中小企业的IT总监,老乡会上认识之后,两人很快成了朋友,经常在工作之余一起打打球、爬爬山、喝喝酒、看看电影(同漫威“死忠粉”),几乎无话不谈。
    至顶网  至顶网云计算频道  2019-01-02 10:53:13  
  • VF-EVAL:评测多模态大语言模型为AI生成视频提供反馈的能力

    这项由中国科学院大学、新加坡国立大学、浙江大学和耶鲁大学研究人员联合发表的研究提出了VF-EVAL,一个专门评估多模态大语言模型对AI生成视频提供反馈能力的新基准。研究通过四项任务:连贯性验证、错误感知、错误类型检测和推理评估,全面测试模型理解合成视频的能力。研究发现即使是最先进的GPT-4.1模型也难以在所有任务上保持良好表现,表明AI对生成视频的理解仍有巨大提升空间。研究还通过REPROMPT实验证明,将大模型反馈与人类偏好更好地对齐可以显著提升视频生成质量。
    至顶网  科技行者  2025-06-03 13:33:15  
  • HTC VIVE发布多款高品质虚拟现实产品,以“软硬双擎”驱动VR新纪元

    HTC正式推出全能VR一体机VIVE FOCUS 3和革新专业级PC-VR VIVE PRO 2,发布VIVE BUSINESS商用平台,为商用和消费者VR设定了新的基准。
    至顶网  业界供稿  2021-05-12 10:20:43  
  • 普渡大学研究团队突破:让人工智能"看见"物体真实大小的神奇方法

    普渡大学研究团队开发的深度平衡正则化器(DEC)解决了AI模型在处理不同大小物体时判断不一致的问题。该方法基于单调缩放群理论,通过潜在空间正则化显著提升了ViT、Swin等模型的尺度一致性和整体准确率,在ImageNet等数据集上表现优异,为自动驾驶、医疗图像分析等应用提供更可靠的视觉识别能力。
    至顶网  科技行者  2025-08-28 11:11:19  
  • 专访|DoorDash掌门人:从濒临倒闭到主宰美国外卖市场,如何缔造一个全新商业帝国

    DoorDash联合创始人兼CEO Tony Xu(徐讯)与YC董事长Garry Tan展开了一场关于创业精髓的访谈,讲述了公司的起源故事、公司如何在几次危机中幸存下来、以及如何改变整个行业。
    至顶网  周雅  2025-04-09 21:22:44  
  • STR-Match:视频编辑的新革命,首尔国立大学团队让视频换装就像换衣服一样简单

    首尔国立大学研究团队提出STR-Match视频编辑技术,通过创新的时空相关性分数(STR分数)解决传统方法在帧一致性、运动保持和域转换方面的局限。该方法无需重新训练模型,可直接应用于现有文本到视频生成模型,在极端编辑场景下仍能保持高质量输出,为视频编辑领域带来突破性进展。
    至顶网  科技行者  2025-07-04 17:20:09  
  • 麻省理工学院突破性研究:教机器像人类一样理解物体的三维世界

    麻省理工学院研究团队开发出突破性的三维场景理解技术,让机器能够像人类一样理解复杂的三维空间。该技术采用分层空间表示和多模态数据融合,在场景重建准确率上达到92.3%,平均定位误差仅2.1厘米。这项技术将广泛应用于机器人、自动驾驶、AR/VR等领域,为人工智能的空间理解能力带来重大突破。
    至顶网  科技行者  2025-08-25 10:26:08  
  • 斯科尔科夫科技学院推出G-CUT3R:让AI秒懂现实世界的3D重建新玩法

    斯科尔科夫科技学院等机构联合开发的G-CUT3R是一种创新的3D重建技术,通过巧妙融合相机参数、深度信息等辅助数据,显著提升了传统仅依赖RGB图像重建方法的准确性和速度。该技术采用轻量级设计和零卷积融合策略,在多个基准测试中表现出色,为自动驾驶、AR/VR、机器人导航等领域的实际应用开辟了新路径。
    至顶网  科技行者  2025-08-27 15:12:46  
  • 语音识别遇上"扩散大脑":剑桥-清华-伊利诺伊团队让机器听得更准确

    这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。
    至顶网  科技行者  2025-10-09 14:35:08  
  • 机器人灵巧操作的"三重奏":港大团队如何让机器人学会优雅地叠衣服

    港大研究团队开发了χ0机器人操作框架,通过模型算术、阶段优势和训练部署对齐三种技术的协同,系统性解决了机器人学习、训练和实际部署三个阶段间的不匹配问题。该系统在复杂的服装操作任务上成功率提升250%,仅用20小时数据和8块GPU就实现了24小时连续稳定运行,为机器人技术从实验室走向日常应用提供了重要突破。
    至顶网  科技行者  2026-02-13 21:52:52  
  • 南洋理工大学团队创新突破:让3D建模像拼图一样简单,多模态数据协同创作高质量3D内容

    新加坡南洋理工大学研究团队提出TriMM系统,这是首个融合RGB图像、深度图和点云数据的3D生成模型。通过协同多模态编码技术,系统能够同时利用彩色图像的丰富纹理和几何数据的精确结构信息,仅用4秒即可从单张图片生成高质量3D模型。该技术在多个数据集上的表现超越现有方法,为3D内容创作提供了新的解决方案。
    至顶网  科技行者  2025-09-04 09:59:44  
  • 伊利诺伊大学团队突破:让AI同时看懂和画出图像,速度提升6倍的革命性架构

    伊利诺伊大学研究团队提出LaTtE-Flow架构,创新性地将多模态理解和图像生成统一在单一模型中。通过层级时间步专家和时间步条件残差注意力两大技术突破,实现6倍推理加速和4倍参数效率提升,同时保持高质量的图像生成和理解性能,为高效多模态AI应用奠定基础。
    至顶网  科技行者  2025-06-19 10:46:22  
  • IBM研究院带来语音理解新突破:让AI更懂人话的训练秘籍

    IBM研究院开发出群体相对策略优化(GRPO)方法来训练语音感知大语言模型,通过让AI生成多个答案并比较优劣进行学习,在语音问答和自动翻译任务上取得显著性能提升。实验显示该方法比传统监督微调效果更好,BLEU分数最高提升10.9%,为语音理解AI的发展开辟了新路径。
    至顶网  科技行者  2025-10-15 12:07:04  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号