搜索大发玩和值的稳定必中方法规【罔芷:——88pk·ee—

上海人工智能实验室最新突破：让AI模型拥有"视觉记忆"，解决长文本中图片内容被遗忘的难题

上海人工智能实验室提出CoMemo架构，通过双路径处理解决视觉语言模型在长文本中的图像遗忘问题。该方法结合上下文路径和记忆路径，配合RoPE-DHR位置编码，在七项任务中显著提升性能，为多模态AI的长上下文处理提供了新的解决方案。

至顶网科技行者 2025-06-24 13:50:00

让AI既能看人脸又能听声音：比利时和美国科学家的多感官"读心术"突破

比利时蒙斯大学和美国南加州大学联合开发了Social-MAE，这是一个能够同时理解人脸表情和声音情感的AI系统。该系统通过分析8个连续视频帧和音频特征，在VoxCeleb2大型社交数据集上进行自监督学习，在情感识别、笑声检测和性格分析三项任务中均达到了业界最佳水平，为智能教育、医疗诊断、人机交互等领域开辟了新的应用前景。

至顶网科技行者 2025-09-05 10:12:02

华盛顿大学最新研究：我们终于能让家用机器人像人类一样优雅地完成日常任务了

华盛顿大学研究团队开发出MUTEX系统，让家用机器人具备类人灵活性。该系统通过扩散策略和分层学习，使机器人能观察人类演示视频自主学习，在陌生环境中适应性完成复杂任务。测试显示成功率提升近一倍，动作更自然流畅。系统具备多任务协调、人机协作和安全保护功能，为未来智能家居和工业应用奠定基础。

至顶网科技行者 2025-06-13 09:45:36

面向2030影响数据存储产业的十大应用（上）：主流应用

本篇先介绍商用阶段的六大主流应用，后面会介绍萌芽期的四个新兴应用。

至顶网业界供稿 2022-01-04 15:29:16

ByteDance推出Mini-o3：让AI像人类侦探一样深度思考的视觉搜索突破

ByteDance团队开发的Mini-o3系统通过深度多轮推理突破了传统AI视觉理解的局限。该系统能像人类侦探般进行几十轮的视觉探索，在困难的视觉搜索任务上准确率达48%，相比现有模型提升显著。核心创新包括挑战性的Visual Probe数据集、多样化推理策略训练和突破性的过轮掩码技术，实现了测试时思考轮数的自然扩展。

至顶网科技行者 2025-09-23 13:39:46

ShareGPT-4o-Image：香港中文大学（深圳）突破性成果，让AI生成图像技术走向全民化

香港中文大学（深圳）团队发布ShareGPT-4o-Image数据集，包含91000个高质量样本，成功训练出开源图像生成模型Janus-4o。该模型不仅在文字生成图像任务上超越前代，更首次实现了图像编辑功能，仅用6小时训练就达到先进水平，为AI图像生成技术的民主化开辟了新路径。

至顶网科技行者 2025-06-30 17:56:57

AI语言生成迎来重大突破：康奈尔团队推出"块扩散"模型，让机器既能快速写作又能精确表达

康奈尔科技学院研究团队开发出突破性的"块扩散"AI语言模型，巧妙结合自回归和扩散模型优势，实现了既快速又准确的文本生成。该技术支持任意长度文本创作，生成速度显著提升，在标准测试中创下扩散模型新纪录，为AI写作助手和对话系统开辟了新的发展路径。

至顶网科技行者 2025-08-01 14:43:14

你敢要它就有！至强6新品治好选择困难症

单核10MB L3？基频 4GHz？32TB内存？各种数据中心CPU升级需求都能在这里找到解决方案。

至顶网至顶网计算频道 2025-03-20 16:07:06

你敢要它就有！至强6新品治好选择困难症

单核10MB L3？基频 4GHz？32TB内存？各种数据中心CPU升级需求都能在这里找到解决方案。

至顶网科技行者 2025-03-20 16:09:22

英特尔发布重大技术架构的改变和创新，面向CPU、GPU和IPU

这些新架构将为即将推出的高性能产品注入动力，并为英特尔的下一个创新时代奠定基础，以满足世界对高计算能力日益增长的需求。

至顶网业界供稿 2021-08-20 09:27:28

想让AI像人一样说话？谷歌DeepMind用魔法般的数据驱动方法让语音合成更自然！

谷歌DeepMind研究团队开发了革命性的语音合成技术，采用数据驱动方法让AI学会像人类一样自然说话。通过观察大量真实语音数据，新系统能够生成更自然、更有情感的语音，在客观测试和主观评价中都显著超越传统方法。这项技术将为智能助手、有声读物、教育软件等领域带来重大改进，同时为语言障碍人群提供帮助，展现了人机交互技术的光明前景。

至顶网科技行者 2025-06-13 09:43:26

阿里巴巴Qwen团队打造史上最强多模态AI：一个模型搞定文字、语音、图像和视频，实时对话延迟仅234毫秒

阿里巴巴Qwen团队发布的Qwen3-Omni实现了AI领域的重大突破，首次让单一模型在文字、语音、图像、视频处理上都达到专业水平，无任何性能损失。该系统支持119种文字语言，实时对话延迟仅234毫秒，在36项测试中32项达到开源最佳。采用创新的"思考者-表达者"架构和多码本流式生成技术，为真正智能的多模态AI助手奠定了基础。

至顶网科技行者 2025-10-09 10:08:25

阿里通义实验室推出WebSailor：首个与顶级闭源系统媲美的开源超级网络智能体

阿里通义实验室发布首个媲美顶级闭源系统的开源超级网络智能体WebSailor，突破性解决开源模型在超高不确定性任务中的系统性推理难题，在BrowseComp基准测试准确率提升3倍，标志着开源技术在复杂信息搜索领域的历史性跨越。

至顶网至顶AI实验室 2025-07-07 16:57:16

机器人终于学会"察言观色"：上海AI实验室让机器人像人类一样边思考边行动

上海AI实验室团队开发的InstructVLA系统实现了机器人"边思考边行动"的突破，解决了传统机器人语言理解与动作执行分离的难题。该系统通过创新的两阶段训练和混合专家架构，让机器人能理解抽象指令并灵活执行任务，在复杂推理任务中比现有系统提升92%，标志着智能机器人助手时代的重要进展。

至顶网科技行者 2025-08-07 14:15:48

AI训练神器"道场"：让网络安全机器人学会真实的黑客攻击

由蒙纳士大学和AWS AI实验室联合开发的CTF-DOJO是全球首个网络安全AI训练环境，包含658个真实CTF挑战。通过创新的CTF-FORGE自动化系统，仅用486个高质量训练样本就让AI在三大权威测试平台上取得显著提升，32B模型达到31.9%成功率，媲美顶级商业系统，为开源AI安全研究开辟新路径。

至顶网科技行者 2025-09-02 16:02:00

VFMTok：让AI图像生成告别"拖拉慢"的时代——香港大学团队的全新突破

香港大学团队开发的VFMTok技术革新了AI图像生成领域，通过使用预训练视觉基础模型和区域适应性采样策略，仅用256个令牌就实现了超越传统方法的图像生成质量。该技术不仅将生成速度提升3倍，还在ImageNet基准测试中创造了2.07的新纪录，为AI图像生成的实际应用奠定了坚实基础。

至顶网科技行者 2025-07-21 11:36:52

AI模型"千里之堤毁于蚁穴"：剑桥大学团队揭示大语言模型长期任务执行的致命缺陷

剑桥大学等机构研究发现，AI模型在长期任务执行中存在致命缺陷：微小的单步改进会带来指数级的长期能力提升，但传统模型会被自己的历史错误"带偏"，出现自我设限效应。思考型模型如GPT-5能执行超过1000步任务，打破了这一限制。研究重新定义了AI价值评估标准，认为长期执行能力比单次交互表现更重要。

至顶网科技行者 2025-09-25 14:42:22

华为老将余承东，字典里没有躺平

余承东的“华为三部曲”

至顶网吴彤 2024-07-04 17:44:24

被仰望和遗忘过的Cloudera是否能王者归来？

经历过Hadoop大起大落的Cloudera还会有一个怎样的未来？

至顶网郭华 2020-04-09 17:13:05

北京邮电大学等机构研究警告：自由进化的AI社区可能失控，安全保障会逐渐消失

北京邮电大学等机构研究发现，AI系统在封闭环境中自我进化时会出现必然的安全退化现象。通过对Moltbook AI社区的观察和小规模实验验证，研究团队证明了AI系统无法同时实现持续进化、完全隔离和安全保障的"不可能三角"。他们提出了四种解决方案来缓解这一问题，为构建安全可控的AI系统提供了重要指导。

至顶网科技行者 2026-02-14 10:31:58