搜一下
用了 0.090184秒,为您找到
大发
玩和值
稳定
中方
法规
罔芷
88pkee
驻测
相关内容7980 条
上海人工智能实验室最新突破:让AI模型拥有"视觉记忆",解决长文本中图片内容被遗忘的难题
上海人工智能实验室提出CoMemo架构,通过双路径处理解决视觉语言模型在长文本中的图像遗忘问题。该方法结合上下文路径和记忆路径,配合RoPE-DHR位置编码,在七项任务中显著提升性能,为多模态AI的长上下文处理提供了新的解决方案。
至顶网
科技行者 2025-06-24 13:50:00
让AI既能看人脸又能听声音:比利时和美国科学家的多感官"读心术"突破
比利时蒙斯大学和美国南加州大学联合开发了Social-MAE,这是一个能够同时理解人脸表情和声音情感的AI系统。该系统通过分析8个连续视频帧和音频特征,在VoxCeleb2大型社交数据集上进行自监督学习,在情感识别、笑声检测和性格分析三项任务中均达到了业界最佳水平,为智能教育、医疗诊断、人机交互等领域开辟了新的应用前景。
至顶网
科技行者 2025-09-05 10:12:02
华盛顿大学最新研究:我们终于能让家用机器人像人类一样优雅地完成日常任务了
华盛顿大学研究团队开发出MUTEX系统,让家用机器人具备类人灵活性。该系统通过扩散策略和分层学习,使机器人能观察人类演示视频自主学习,在陌生环境中适应性完成复杂任务。测试显示成功率提升近一倍,动作更自然流畅。系统具备多任务协调、人机协作和安全保护功能,为未来智能家居和工业应用奠定基础。
至顶网
科技行者 2025-06-13 09:45:36
面向2030影响数据存储产业的十大应用(上):主流应用
本篇先介绍商用阶段的六大主流应用,后面会介绍萌芽期的四个新兴应用。
至顶网
业界供稿 2022-01-04 15:29:16
ByteDance推出Mini-o3:让AI像人类侦探一样深度思考的视觉搜索突破
ByteDance团队开发的Mini-o3系统通过深度多轮推理突破了传统AI视觉理解的局限。该系统能像人类侦探般进行几十轮的视觉探索,在困难的视觉搜索任务上准确率达48%,相比现有模型提升显著。核心创新包括挑战性的Visual Probe数据集、多样化推理策略训练和突破性的过轮掩码技术,实现了测试时思考轮数的自然扩展。
至顶网
科技行者 2025-09-23 13:39:46
ShareGPT-4o-Image:香港中文大学(深圳)突破性成果,让AI生成图像技术走向全民化
香港中文大学(深圳)团队发布ShareGPT-4o-Image数据集,包含91000个高质量样本,成功训练出开源图像生成模型Janus-4o。该模型不仅在文字生成图像任务上超越前代,更首次实现了图像编辑功能,仅用6小时训练就达到先进水平,为AI图像生成技术的民主化开辟了新路径。
至顶网
科技行者 2025-06-30 17:56:57
AI语言生成迎来重大突破:康奈尔团队推出"块扩散"模型,让机器既能快速写作又能精确表达
康奈尔科技学院研究团队开发出突破性的"块扩散"AI语言模型,巧妙结合自回归和扩散模型优势,实现了既快速又准确的文本生成。该技术支持任意长度文本创作,生成速度显著提升,在标准测试中创下扩散模型新纪录,为AI写作助手和对话系统开辟了新的发展路径。
至顶网
科技行者 2025-08-01 14:43:14
你敢要它就有!至强6新品治好选择困难症
单核10MB L3?基频 4GHz?32TB内存?各种数据中心CPU升级需求都能在这里找到解决方案。
至顶网
至顶网计算频道 2025-03-20 16:07:06
你敢要它就有!至强6新品治好选择困难症
单核10MB L3?基频 4GHz?32TB内存?各种数据中心CPU升级需求都能在这里找到解决方案。
至顶网
科技行者 2025-03-20 16:09:22
英特尔发布重大技术架构的改变和创新,面向CPU、GPU和IPU
这些新架构将为即将推出的高性能产品注入动力,并为英特尔的下一个创新时代奠定基础,以满足世界对高计算能力日益增长的需求。
至顶网
业界供稿 2021-08-20 09:27:28
想让AI像人一样说话?谷歌DeepMind用魔法般的数据驱动方法让语音合成更自然!
谷歌DeepMind研究团队开发了革命性的语音合成技术,采用数据驱动方法让AI学会像人类一样自然说话。通过观察大量真实语音数据,新系统能够生成更自然、更有情感的语音,在客观测试和主观评价中都显著超越传统方法。这项技术将为智能助手、有声读物、教育软件等领域带来重大改进,同时为语言障碍人群提供帮助,展现了人机交互技术的光明前景。
至顶网
科技行者 2025-06-13 09:43:26
阿里巴巴Qwen团队打造史上最强多模态AI:一个模型搞定文字、语音、图像和视频,实时对话延迟仅234毫秒
阿里巴巴Qwen团队发布的Qwen3-Omni实现了AI领域的重大突破,首次让单一模型在文字、语音、图像、视频处理上都达到专业水平,无任何性能损失。该系统支持119种文字语言,实时对话延迟仅234毫秒,在36项测试中32项达到开源最佳。采用创新的"思考者-表达者"架构和多码本流式生成技术,为真正智能的多模态AI助手奠定了基础。
至顶网
科技行者 2025-10-09 10:08:25
阿里通义实验室推出WebSailor:首个与顶级闭源系统媲美的开源超级网络智能体
阿里通义实验室发布首个媲美顶级闭源系统的开源超级网络智能体WebSailor,突破性解决开源模型在超高不确定性任务中的系统性推理难题,在BrowseComp基准测试准确率提升3倍,标志着开源技术在复杂信息搜索领域的历史性跨越。
至顶网
至顶AI实验室 2025-07-07 16:57:16
机器人终于学会"察言观色":上海AI实验室让机器人像人类一样边思考边行动
上海AI实验室团队开发的InstructVLA系统实现了机器人"边思考边行动"的突破,解决了传统机器人语言理解与动作执行分离的难题。该系统通过创新的两阶段训练和混合专家架构,让机器人能理解抽象指令并灵活执行任务,在复杂推理任务中比现有系统提升92%,标志着智能机器人助手时代的重要进展。
至顶网
科技行者 2025-08-07 14:15:48
AI训练神器"道场":让网络安全机器人学会真实的黑客攻击
由蒙纳士大学和AWS AI实验室联合开发的CTF-DOJO是全球首个网络安全AI训练环境,包含658个真实CTF挑战。通过创新的CTF-FORGE自动化系统,仅用486个高质量训练样本就让AI在三大权威测试平台上取得显著提升,32B模型达到31.9%成功率,媲美顶级商业系统,为开源AI安全研究开辟新路径。
至顶网
科技行者 2025-09-02 16:02:00
VFMTok:让AI图像生成告别"拖拉慢"的时代——香港大学团队的全新突破
香港大学团队开发的VFMTok技术革新了AI图像生成领域,通过使用预训练视觉基础模型和区域适应性采样策略,仅用256个令牌就实现了超越传统方法的图像生成质量。该技术不仅将生成速度提升3倍,还在ImageNet基准测试中创造了2.07的新纪录,为AI图像生成的实际应用奠定了坚实基础。
至顶网
科技行者 2025-07-21 11:36:52
AI模型"千里之堤毁于蚁穴":剑桥大学团队揭示大语言模型长期任务执行的致命缺陷
剑桥大学等机构研究发现,AI模型在长期任务执行中存在致命缺陷:微小的单步改进会带来指数级的长期能力提升,但传统模型会被自己的历史错误"带偏",出现自我设限效应。思考型模型如GPT-5能执行超过1000步任务,打破了这一限制。研究重新定义了AI价值评估标准,认为长期执行能力比单次交互表现更重要。
至顶网
科技行者 2025-09-25 14:42:22
华为老将余承东,字典里没有躺平
余承东的“华为三部曲”
至顶网
吴彤 2024-07-04 17:44:24
被仰望和遗忘过的Cloudera是否能王者归来?
经历过Hadoop大起大落的Cloudera还会有一个怎样的未来?
至顶网
郭华 2020-04-09 17:13:05
北京邮电大学等机构研究警告:自由进化的AI社区可能失控,安全保障会逐渐消失
北京邮电大学等机构研究发现,AI系统在封闭环境中自我进化时会出现必然的安全退化现象。通过对Moltbook AI社区的观察和小规模实验验证,研究团队证明了AI系统无法同时实现持续进化、完全隔离和安全保障的"不可能三角"。他们提出了四种解决方案来缓解这一问题,为构建安全可控的AI系统提供了重要指导。
至顶网
科技行者 2026-02-14 10:31:58
<
上一页
379
380
381
382
383
384
385
386
387
388
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号