用了 0.086903秒,为您找到AG 手机 客户端 登录 網纸 YB233相关内容4517 条
  • 谷歌CEO皮查伊两小时访谈:AI是人类所见过最深远的技术,意义将超越火与电,因为它可以自我迭代

    谷歌CEO皮查伊在AI竞赛低谷期坚持"信号降噪"原则,顶住压力加倍投入,最终带领谷歌凭借Gemini系列重夺领先。他坚信AI将超越火与电的革命性影响,通过递归自我改进极大降低创意实现门槛,这场"创造力民主化"浪潮或将解锁80亿人的认知潜能。
    至顶网  至顶AI实验室  2025-06-09 16:34:01  
  • 布尔诺工业大学团队突破语音识别瓶颈:让机器更准确理解人类话语的新方法

    布尔诺工业大学研究团队开发了DeCRED方法,通过在语音识别系统解码器中添加辅助监督,显著提升了系统在未知领域的泛化能力。该方法将域外测试错误率从18.2%降至16.2%,仅用1.72亿参数就达到了接近大型模型的性能。
    至顶网  科技行者  2025-08-15 08:29:33  
  • SonicMaster:新加坡科技设计大学团队让破音音乐起死回生的神奇技术

    新加坡科技设计大学研究团队开发出SonicMaster,这是首个支持自然语言控制的统一音频修复系统。该系统能够同时处理音乐录制中的19种常见问题,包括混响、削波、频响不平衡等,用户只需用普通话描述需求即可获得专业级处理效果。研究团队构建了包含17.5万音频样本的训练数据集,测试显示系统在客观指标和主观听感上均显著优于传统方法,为音频处理技术的普及应用提供了新思路。
    至顶网  科技行者  2025-08-08 13:06:28  
  • 黄仁勋北京媒体会:如何用十个AI方法论改变世界?

    黄仁勋于昨天(7月16日)参加了在北京举行的第三届链博会,并于下午举行了长达90分钟的记者会。
    至顶网  至顶AI实验室  2025-07-17 08:35:46  
  • 谷歌DeepMind让AI大脑学会了超强"语言视觉连接",一个模型懂36种语言还能精准定位

    谷歌DeepMind团队开发的SigLIP 2是新一代多语言视觉-语言编码器,支持36种语言的图像理解。通过创新的分阶段训练方法,结合解码器训练、自蒸馏学习和智能数据筛选,实现了在零样本分类、图像检索、精准定位等任务上的全面突破。该系统还采用去偏见技术,显著提升了文化公平性,为全球化AI应用奠定重要基础。
    至顶网  科技行者  2025-08-26 10:18:38  
  • 关山不再难越,IBM公有云为中国出海企业提供最佳路径

    IBM将继续聚焦这个时代最具变革性的企业技术——混合云和AI ,帮助出海客户一次构建、随处运行和托管他们的关键工作负载,提供无缝体验,帮助他们把 AI 的能力注入其技术架构、系统和业务流程中,全力支持中国出海企业的全球化发展。
    至顶网  业界供稿  2023-03-23 16:49:06  
  • MIT:让AI画画也能"抄近路"——从256步到20步的图像生成革命

    MIT研究团队突破传统AI图像生成瓶颈,开发出局部感知并行解码技术,将生成步骤从256步减少至20步,速度提升12.8倍。该技术通过发现AI绘图中的空间局部性规律,重新设计了生成架构,让AI能够同时在多个区域并行"作画"而不影响质量,为实时图像生成应用开辟新道路。
    至顶网  科技行者  2025-07-04 17:20:25  
  • OPPO研究团队突破AI智能体技术瓶颈:首个系统性评估框架让AI助手真正"智能"起来

    OPPO研究团队通过系统性实验发现当前AI智能体研究缺乏统一标准,开发出模块化的OAgents框架,在GAIA基准测试中达到73.93%的领先成绩。该研究建立了严格的评估协议,将智能体能力分为事实获取和逻辑推理两个维度,为行业提供了标准化的工具和方法,推动AI智能体研究走向科学化和规范化。
    至顶网  科技行者  2025-06-26 12:52:10  
  • 蚂蚁集团包容性AI团队重磅发布Ming-Omni:首个媲美GPT-4o的开源全能AI模型

    这项由蚂蚁集团包容性AI团队完成的研究发布了Ming-Omni,这是首个媲美GPT-4o的开源多模态AI模型。该模型能够同时处理文字、图像、音频和视频,并具备语音和图像生成能力。采用MoE架构和模态特定路由器,仅需激活2.8B参数就能达到与7B参数模型相当的性能。在多项基准测试中创造新纪录,特别是在语音理解、图像生成和多模态融合方面表现突出。
    至顶网  科技行者  2025-06-18 09:23:26  
  • 会议观察 | 2023世界人工智能大会WAIC精彩回顾

    2023世界人工智能大会WAIC在上海召开。
    至顶网  孙硕  2023-07-14 11:36:05  
  • 斯坦福大学发布新一代GloVe词向量:十年后的语言"翻译官"大升级

    斯坦福大学NLP研究小组发布了全新的2024版GloVe词向量,这是对2014年原版的重大升级。新版本使用维基百科、Gigaword新闻数据和Dolma语料库进行训练,新增超过70万词汇,涵盖疫情、科技、网络文化等现代概念。测试显示新版本在处理当代文本、非西方人名地名和社交媒体内容方面表现显著优于旧版本,为自然语言处理应用提供了更准确的语言理解工具。
    至顶网  科技行者  2025-07-29 12:03:43  
  • Gradient团队突破分布式训练瓶颈:ECHO-2让AI训练成本骤降35%!

    Gradient公司联合多所知名学府开发的ECHO-2框架通过分布式架构突破了传统AI训练的成本瓶颈。该系统巧妙地将训练过程分解为三个独立车间,让便宜设备承担数据生成任务,昂贵设备专注核心学习,并允许适度的数据延迟来换取更高的资源利用效率。实验证明在保持模型质量的同时成功降低训练成本35%以上,为AI技术普及奠定了重要基础。
    至顶网  科技行者  2026-02-13 08:32:06  
  • 用AI"慧眼"保护非洲野生动物:从传统CNN到视觉变换器的技术革命

    这项由尼日利亚阿雷瓦数据科学学院主导的国际研究,通过对比DenseNet、ResNet、EfficientNet和Vision Transformer四种深度学习模型,为非洲野生动物保护提供了AI技术解决方案。研究发现DenseNet-201在实用性和准确率间达到最佳平衡,并成功部署了在线识别应用,为AI技术服务野生动物保护事业提供了完整的从理论到实践的范例。
    至顶网  科技行者  2025-08-05 13:21:09  
  • 探寻魔都“引力场”:AI创新者为何在这片土地集体找到归属感?

    这两家公司,一个是向内拷问人性的AI先锋,一个是向外探索物理极限的AI长跑者,却都将事业锚点,落在漕河泾开发区时,一个题目浮现了:这片土地的科创引力从何而来?
    至顶网  周雅  2025-07-24 16:29:03  
  • AI的故事:半人马的诞生之路

    我们将讲述AI的一位被遗忘的“表亲”——IA,即智能增强。长久以来,人们思考的一直是人类大脑如何对抗人工硅脑的问题。但在IA层面,我们需要探讨的则是如何让人类大脑与人工硅脑共同合作。
    至顶网  科技行者  2018-03-09 14:29:33  
  • 新加坡团队突破!一张照片秒变4D世界:让静态画面"活"起来的黑科技

    新加坡南洋理工大学团队开发的4DNeX系统实现了从单张照片生成完整4D动态场景的突破。该技术采用6D视频表示法融合RGB颜色和XYZ空间信息,构建了包含920万帧数据的4DNeX-10M大规模数据集,通过改进视频扩散模型实现15分钟内的高效生成,在动态程度和一致性指标上显著优于现有方法,为虚拟现实、影视制作等领域提供了新的技术路径。
    至顶网  科技行者  2025-08-26 14:18:34  
  • 让记忆力超群的人工神经网络"记住"更多:意大利比萨大学团队破解深度学习记忆难题

    意大利比萨大学研究团队开发出深度残差回声状态网络(DeepResESN),通过创新的"时间残差连接"技术解决了深度神经网络的长期记忆问题。该方法在记忆性任务上性能提升65%以上,同时保持了储层计算训练快速的优势。研究提供了完整的数学理论分析和三类任务的实验验证,为需要长期记忆的AI应用(如天气预测、医疗诊断、金融分析)提供了新的技术选择。
    至顶网  科技行者  2025-09-08 10:16:49  
  • 亚马逊研究团队推出BeepBank-500:让电子音效研究变得像搭积木一样简单

    亚马逊首席科学家Mandip Goswami发布BeepBank-500开源数据集,包含300-500个参数化合成电子音效,专为听觉界面研究设计。该数据集提供完整的元数据标注、可重现的生成脚本和基准测试,音频采用CC0-1.0许可证完全开放,填补了电子音效研究领域缺乏标准化工具的空白,为心理声学和人机交互研究提供了便捷的实验材料。
    至顶网  科技行者  2025-10-13 09:02:05  
  • 多模态AI学会了自己"动手":清华、科大携手Kwai发布会自主编程处理图像的智能助手

    清华、中科大联合Kwai团队开发的Thyme系统实现了多模态AI的重大突破,让AI模型具备了自主编写代码处理图像和进行数学计算的能力。通过创新的两阶段训练策略和GRPO-ATS算法,Thyme在近20个评测基准上都表现出显著性能提升,特别是在高分辨率图像处理和复杂推理任务中表现突出,代表了AI从被动"看图说话"向主动"动手解决问题"的重要转变。
    至顶网  科技行者  2025-08-19 12:35:48  
  • DreamCube:香港大学团队突破传统,让AI从一张照片"脑补"出整个360度世界

    香港大学团队突破性地解决了AI全景图生成中的拼接难题,提出DreamCube系统,能从单张照片生成包含深度信息的完整360度场景。该研究创新性地引入"多平面同步"技术,让AI同时协调处理立方体六个面,避免传统方法的色差和断裂问题,实现从2D图像到3D场景的快速转换,为VR/AR、游戏开发、建筑设计等领域提供了全新的内容创作工具。
    至顶网  科技行者  2025-06-25 13:31:14  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号