用了 0.087252秒,为您找到AG 手机 客户端 登录 網纸 YB233相关内容6904 条
  • 南开大学团队推出DepthAnything-AC:让AI在恶劣天气中也能精准"看懂"距离

    南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。
    至顶网  科技行者  2025-07-04 10:32:53  
  • 锵锵三人行:新一代IBM z16为构建企业未来而生

    2022年5月24日,IBM在中国正式发布新一代的主机系统——IBM z16。z16是浓缩了IBM的领先科技、行业洞见及远见,结合混合云与AI时代关键应用的新需求,与全球不同行业的客户和合作伙伴携手共创、共同设计开发出来的。
    至顶网  业界供稿  2022-06-07 11:05:09  
  • 企业云转型出现双行道,可持续的技术与伙伴不可或缺

    在2022年收官之际,IBM副总裁、IBM中国总经理缪可延携IBM大中华区科技事业部技术销售总经理陈国豪和IBM大中华区科技事业部客户成功管理部总经理朱辉一起,与媒体分享了IBM对于企业云转型的最新洞察。
    至顶网  业界供稿  2022-12-15 20:46:38  
  • 中科院团队揭示深度学习优化与评估的隐秘矛盾:为什么最好的评分模型不一定带来最佳训练效果

    中科院微电子研究所团队揭示深度学习中感知优化与质量评估存在意外不对称现象。研究发现评估性能优秀的模型在训练指导中效果有限,对抗性训练具主导作用,传统卷积网络在某些场景仍具优势。这项发现颠覆了"评估性能等同于优化能力"的传统认知,为AI图像处理技术改进提供新方向。
    至顶网  科技行者  2025-10-16 15:13:26  
  • 新加坡南洋理工大学重新定义3D重建:像智能手机看视频一样理解三维世界

    新加坡南洋理工大学研究团队开发的STREAM3R系统革命性地改变了3D重建方式,采用流式处理技术像阅读故事一样按序处理图像,而非传统的同时处理所有图像。该系统实现每秒12-33帧的实时处理速度,准确度高达94.7%,特别擅长处理动态场景,为自动驾驶、机器人导航和虚拟现实应用开辟了新可能。
    至顶网  科技行者  2025-08-19 10:40:49  
  • 南京大学联合美团发布ScaleEnv框架:让AI智能体自学成才的终极训练场

    这项研究开发了ScaleEnv框架,能够从简单关键词自动构建完整的AI训练环境。通过程序化测试和双阶段构建,确保虚拟环境的真实可靠。实验证明,在此框架训练的AI智能体在跨领域测试中表现显著提升,验证了环境多样性对AI泛化能力的重要作用,为AI训练方法开辟了新方向。
    至顶网  科技行者  2026-02-12 13:32:27  
  • 盘点2018年中国私有云市场:繁荣依旧,向混合云演进

    2018年,行业云发展趋势更为明显,每个行业都逐渐形成了自身行业的云计算落地流程和样板案例,极大的促进了私有云建设的落地。同样私有云模式也正在改变着行业企业的业务模式和发展方式。
    至顶网  至顶网软件频道  2018-12-26 10:48:41  
  • AI终于学会了记忆:南洋理工大学团队让虚拟世界永不遗忘的突破性进展

    南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
    至顶网  科技行者  2025-07-11 15:23:52  
  • 解剖自然图像的秘密:伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"

    这篇研究来自加州大学伯克利分校和谷歌研究院团队,探讨了什么让图像看起来"自然"这一问题。论文提出了一种识别自然图像特征的深度学习方法,通过训练神经网络区分真实照片与人工处理的图像,并能将"不自然"的图像转化为更自然的版本。研究不仅揭示了自然图像在颜色分布、纹理特征和内容语义等方面的规律,还展示了在图像修复、质量提升和伪造检测等领域的潜在应用,为理解人类视觉感知和改进AI图像生成提供了新视角。
    至顶网  科技行者  2025-07-07 17:32:15  
  • 北京大学联合字节跳动推出MoVieS:用一秒钟就能从单镜头视频中生成4D动态场景的神奇技术

    北京大学联合字节跳动推出MoVieS技术,能够从单镜头视频中快速重建4D动态场景。该系统采用"动态溅射像素"概念,统一处理场景外观、几何和运动信息,在一秒内完成传统方法需要数小时的重建任务。技术支持新视角合成、3D点追踪、场景流估计等多种应用,在保持高质量的同时实现数量级的速度提升。
    至顶网  科技行者  2025-07-22 09:23:44  
  • 阿里团队突破多角色动画难题:FantasyPortrait让静态照片开口说话更自然

    阿里团队开发的FantasyPortrait系统突破了传统人像动画的局限,通过隐式表情表示和掩码交叉注意力机制,实现了高质量的单人和多人肖像动画生成,特别在跨身份表情迁移方面表现出色,为视频制作和虚拟交流等领域带来新的技术可能性。
    至顶网  业界供稿  2025-07-22 16:01:53  
  • 创新再升级,办公更智慧 华为MateBook系列多款新品齐发

    全球首款i9 Evo认证笔记本电脑华为MateBook 16s i9版本、华为首款大屏高性能轻巧本华为MateBook D 16、华为MateBook 14、华为MateBook D 14、华为显示器新成员华为MateView SE以及全新华为无线鼠标同台发布。
    至顶网  业界供稿  2022-05-23 21:56:01  
  • VF-EVAL:评测多模态大语言模型为AI生成视频提供反馈的能力

    这项由中国科学院大学、新加坡国立大学、浙江大学和耶鲁大学研究人员联合发表的研究提出了VF-EVAL,一个专门评估多模态大语言模型对AI生成视频提供反馈能力的新基准。研究通过四项任务:连贯性验证、错误感知、错误类型检测和推理评估,全面测试模型理解合成视频的能力。研究发现即使是最先进的GPT-4.1模型也难以在所有任务上保持良好表现,表明AI对生成视频的理解仍有巨大提升空间。研究还通过REPROMPT实验证明,将大模型反馈与人类偏好更好地对齐可以显著提升视频生成质量。
    至顶网  科技行者  2025-06-03 13:33:15  
  • HTC VIVE发布多款高品质虚拟现实产品,以“软硬双擎”驱动VR新纪元

    HTC正式推出全能VR一体机VIVE FOCUS 3和革新专业级PC-VR VIVE PRO 2,发布VIVE BUSINESS商用平台,为商用和消费者VR设定了新的基准。
    至顶网  业界供稿  2021-05-12 10:20:43  
  • 普渡大学研究团队突破:让人工智能"看见"物体真实大小的神奇方法

    普渡大学研究团队开发的深度平衡正则化器(DEC)解决了AI模型在处理不同大小物体时判断不一致的问题。该方法基于单调缩放群理论,通过潜在空间正则化显著提升了ViT、Swin等模型的尺度一致性和整体准确率,在ImageNet等数据集上表现优异,为自动驾驶、医疗图像分析等应用提供更可靠的视觉识别能力。
    至顶网  科技行者  2025-08-28 11:11:19  
  • 专访|DoorDash掌门人:从濒临倒闭到主宰美国外卖市场,如何缔造一个全新商业帝国

    DoorDash联合创始人兼CEO Tony Xu(徐讯)与YC董事长Garry Tan展开了一场关于创业精髓的访谈,讲述了公司的起源故事、公司如何在几次危机中幸存下来、以及如何改变整个行业。
    至顶网  周雅  2025-04-09 21:22:44  
  • STR-Match:视频编辑的新革命,首尔国立大学团队让视频换装就像换衣服一样简单

    首尔国立大学研究团队提出STR-Match视频编辑技术,通过创新的时空相关性分数(STR分数)解决传统方法在帧一致性、运动保持和域转换方面的局限。该方法无需重新训练模型,可直接应用于现有文本到视频生成模型,在极端编辑场景下仍能保持高质量输出,为视频编辑领域带来突破性进展。
    至顶网  科技行者  2025-07-04 17:20:09  
  • 麻省理工学院突破性研究:教机器像人类一样理解物体的三维世界

    麻省理工学院研究团队开发出突破性的三维场景理解技术,让机器能够像人类一样理解复杂的三维空间。该技术采用分层空间表示和多模态数据融合,在场景重建准确率上达到92.3%,平均定位误差仅2.1厘米。这项技术将广泛应用于机器人、自动驾驶、AR/VR等领域,为人工智能的空间理解能力带来重大突破。
    至顶网  科技行者  2025-08-25 10:26:08  
  • 斯科尔科夫科技学院推出G-CUT3R:让AI秒懂现实世界的3D重建新玩法

    斯科尔科夫科技学院等机构联合开发的G-CUT3R是一种创新的3D重建技术,通过巧妙融合相机参数、深度信息等辅助数据,显著提升了传统仅依赖RGB图像重建方法的准确性和速度。该技术采用轻量级设计和零卷积融合策略,在多个基准测试中表现出色,为自动驾驶、AR/VR、机器人导航等领域的实际应用开辟了新路径。
    至顶网  科技行者  2025-08-27 15:12:46  
  • 语音识别遇上"扩散大脑":剑桥-清华-伊利诺伊团队让机器听得更准确

    这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。
    至顶网  科技行者  2025-10-09 14:35:08  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号