用了 0.054972秒,为您找到bob 手机 在线 網纸 YB233相关内容4411 条
  • VF-EVAL:评测多模态大语言模型为AI生成视频提供反馈的能力

    这项由中国科学院大学、新加坡国立大学、浙江大学和耶鲁大学研究人员联合发表的研究提出了VF-EVAL,一个专门评估多模态大语言模型对AI生成视频提供反馈能力的新基准。研究通过四项任务:连贯性验证、错误感知、错误类型检测和推理评估,全面测试模型理解合成视频的能力。研究发现即使是最先进的GPT-4.1模型也难以在所有任务上保持良好表现,表明AI对生成视频的理解仍有巨大提升空间。研究还通过REPROMPT实验证明,将大模型反馈与人类偏好更好地对齐可以显著提升视频生成质量。
    至顶网  科技行者  2025-06-03 13:33:15  
  • HTC VIVE发布多款高品质虚拟现实产品,以“软硬双擎”驱动VR新纪元

    HTC正式推出全能VR一体机VIVE FOCUS 3和革新专业级PC-VR VIVE PRO 2,发布VIVE BUSINESS商用平台,为商用和消费者VR设定了新的基准。
    至顶网  业界供稿  2021-05-12 10:20:43  
  • 普渡大学研究团队突破:让人工智能"看见"物体真实大小的神奇方法

    普渡大学研究团队开发的深度平衡正则化器(DEC)解决了AI模型在处理不同大小物体时判断不一致的问题。该方法基于单调缩放群理论,通过潜在空间正则化显著提升了ViT、Swin等模型的尺度一致性和整体准确率,在ImageNet等数据集上表现优异,为自动驾驶、医疗图像分析等应用提供更可靠的视觉识别能力。
    至顶网  科技行者  2025-08-28 11:11:19  
  • 专访|DoorDash掌门人:从濒临倒闭到主宰美国外卖市场,如何缔造一个全新商业帝国

    DoorDash联合创始人兼CEO Tony Xu(徐讯)与YC董事长Garry Tan展开了一场关于创业精髓的访谈,讲述了公司的起源故事、公司如何在几次危机中幸存下来、以及如何改变整个行业。
    至顶网  周雅  2025-04-09 21:22:44  
  • STR-Match:视频编辑的新革命,首尔国立大学团队让视频换装就像换衣服一样简单

    首尔国立大学研究团队提出STR-Match视频编辑技术,通过创新的时空相关性分数(STR分数)解决传统方法在帧一致性、运动保持和域转换方面的局限。该方法无需重新训练模型,可直接应用于现有文本到视频生成模型,在极端编辑场景下仍能保持高质量输出,为视频编辑领域带来突破性进展。
    至顶网  科技行者  2025-07-04 17:20:09  
  • 麻省理工学院突破性研究:教机器像人类一样理解物体的三维世界

    麻省理工学院研究团队开发出突破性的三维场景理解技术,让机器能够像人类一样理解复杂的三维空间。该技术采用分层空间表示和多模态数据融合,在场景重建准确率上达到92.3%,平均定位误差仅2.1厘米。这项技术将广泛应用于机器人、自动驾驶、AR/VR等领域,为人工智能的空间理解能力带来重大突破。
    至顶网  科技行者  2025-08-25 10:26:08  
  • 斯科尔科夫科技学院推出G-CUT3R:让AI秒懂现实世界的3D重建新玩法

    斯科尔科夫科技学院等机构联合开发的G-CUT3R是一种创新的3D重建技术,通过巧妙融合相机参数、深度信息等辅助数据,显著提升了传统仅依赖RGB图像重建方法的准确性和速度。该技术采用轻量级设计和零卷积融合策略,在多个基准测试中表现出色,为自动驾驶、AR/VR、机器人导航等领域的实际应用开辟了新路径。
    至顶网  科技行者  2025-08-27 15:12:46  
  • 南洋理工大学团队创新突破:让3D建模像拼图一样简单,多模态数据协同创作高质量3D内容

    新加坡南洋理工大学研究团队提出TriMM系统,这是首个融合RGB图像、深度图和点云数据的3D生成模型。通过协同多模态编码技术,系统能够同时利用彩色图像的丰富纹理和几何数据的精确结构信息,仅用4秒即可从单张图片生成高质量3D模型。该技术在多个数据集上的表现超越现有方法,为3D内容创作提供了新的解决方案。
    至顶网  科技行者  2025-09-04 09:59:44  
  • 伊利诺伊大学团队突破:让AI同时看懂和画出图像,速度提升6倍的革命性架构

    伊利诺伊大学研究团队提出LaTtE-Flow架构,创新性地将多模态理解和图像生成统一在单一模型中。通过层级时间步专家和时间步条件残差注意力两大技术突破,实现6倍推理加速和4倍参数效率提升,同时保持高质量的图像生成和理解性能,为高效多模态AI应用奠定基础。
    至顶网  科技行者  2025-06-19 10:46:22  
  • 上海交大团队推出SmallThinker:让AI大模型在普通电脑上飞奔的神奇技术

    上海交通大学团队开发了SmallThinker AI模型家族,专为本地设备优化。通过创新的稀疏化架构和预注意力路由器,模型在普通CPU上可达20+词/秒生成速度,仅需1-8GB内存。在MMLU等标准测试中表现优异,证明了高效本地AI部署的可能性,为AI技术普及提供了新路径。
    至顶网  科技行者  2025-08-05 10:33:09  
  • 阿里云如何让“创新扩散”,做中国企业出海的隐形推手?

    如今进入全面被AI渗透的时代,AI创新将再次重塑云计算的底层能力,并在全球化进程中与云相互赋能、共同成长,推动中国企业实现全球化布局与技术升级的双向奔赴。
    至顶网  高飞  2025-03-11 20:34:02  
  • 混合云100问「决策篇」:为企业上云“掌舵”

    混合云并不是公有云与私有云的简单组合,而是将这两者进行了有效整合,实现了任务的统一调度和编排。
    至顶网  至顶网软件与服务频道  2020-09-17 18:16:16  
  • 2022年银行数字化转型八大发展趋势

    银行的业务和管理向着线上化、数字化、智能化演进,银行的价值链也由封闭走向开放。但是,银行的数字化转型在覆盖的广度与深度上均有不足,尚未实现“全局性、规模化、可持续”的变革。
    至顶网  元年研究院  2022-04-08 14:44:02  
  • 想让AI像人一样说话?谷歌DeepMind用魔法般的数据驱动方法让语音合成更自然!

    谷歌DeepMind研究团队开发了革命性的语音合成技术,采用数据驱动方法让AI学会像人类一样自然说话。通过观察大量真实语音数据,新系统能够生成更自然、更有情感的语音,在客观测试和主观评价中都显著超越传统方法。这项技术将为智能助手、有声读物、教育软件等领域带来重大改进,同时为语言障碍人群提供帮助,展现了人机交互技术的光明前景。
    至顶网  科技行者  2025-06-13 09:43:26  
  • Google发布Gemma 2 2B和Gemini 1.5 Pro,FLUX开源图像的新标杆,这就是这周的AI大新闻。

    本周AI大事件包括Google发布Gemini 1.5 Pro和Gemma 2 2B模型,FLUX开源图像模型,Meta发布SAM 2图像分割模型。Gemini 1.5 Pro在LLM竞技场排名第一,支持音频和视频,Gemma 2 2B可在设备端运行。FLUX系列模型包括FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell],
    至顶网  数字生命卡兹克  2024-08-05 20:04:27  
  • 从讲师到up主,一位程序员为何能抓住流量密码

    「杨中科怎么也没想到,作为一个大龄程序员,他竟然以这样的方式走红了」
    至顶网  尼酱  2022-08-01 11:04:31  
  • ByteDance突破性AI技术:DreamPoster让每个人都能设计出专业级海报

    ByteDance智能创作实验室开发的DreamPoster系统,能够根据用户提供的图片和文字描述自动生成专业级海报设计。该系统通过创新的数据处理管道、渐进式训练策略和多模态架构,在用户满意度测试中达到88.55%的高分,远超GPT-4o等竞争系统,将很快在Jimeng等平台上线。
    至顶网  科技行者  2025-07-22 10:19:12  
  • ZeroGUI:零人工成本下自动化在线GUI学习的突破性研究

    ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。
    至顶网  科技行者  2025-06-03 18:35:51  
  • NVIDIA团队突破性研究:让AI推理像魔法一样又快又准的超级压缩术

    NVIDIA与爱丁堡大学联合团队于2025年提出的动态内存稀疏化技术,通过智能的延迟删除策略实现AI推理系统的高效内存管理,在保持准确性的同时大幅提升处理速度。该技术只需1000个训练步骤就能实现8倍压缩率,在多项复杂推理任务上显著优于传统方法,为AI技术的普及应用开辟了新路径。
    至顶网  科技行者  2025-06-11 07:50:51  
  • 当机器人像人一样"看懂"世界:上海AI实验室让机器人在任何环境都能自由导航

    上海AI实验室联合多所知名高校开发的NavDP系统实现了机器人导航的重大突破。该系统仅通过虚拟环境训练就能让不同类型机器人在真实世界中自由导航,无需地图或预先调试。核心创新包括大规模虚拟数据生成、扩散模型轨迹规划和智能安全评估机制,实现了真正的跨平台零样本迁移,为机器人技术产业化奠定了重要基础。
    至顶网  科技行者  2025-07-09 11:54:05  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号