搜索 ku游娱乐代理【網纸——YB233典CN—

机器人大脑中的"想象力"：让AI学会预测复杂运动的新技术突破

加州大学伯克利分校研究团队开发出"分层运动预测网络"，让AI通过观看视频学会预测复杂物体运动，无需精确物理计算。系统在简单运动预测中达91%准确率，复杂场景78%，某些情况下超越人类判断。技术有望应用于机器人、自动驾驶、家庭服务等领域，为AI理解物理世界开辟新路径。

至顶网科技行者 2025-07-25 11:46:11

对话澜码科技创始人周健：大模型的下一个开垦地，AI Agent！

为什么选择做AI Agent？澜码科技创始人兼CEO周健的解释是：传统的系统是人适应机器，造成人成为数据的搬运工；今天有了大模型，我们有机会让机器去适应人，在这方面AI Agent前景广阔。

至顶网周雅 2024-01-16 11:50:17

“算透”用户，抖音为什么让人沉迷？

抖音成为2020年1月美国下载数量最高的应用。

至顶网科技行者 2020-06-10 14:51:20

英特尔酷睿Ultra处理器正式发布，230款机型开启AI PC新纪元

今天，英特尔在北京举办以“AI 无处不在，创芯无所不及”为主题的2023 英特尔新品发布会暨 AI 技术创新派对。

至顶网业界供稿 2023-12-16 08:39:08

大语言模型为什么老是"胡编乱造"？OpenAI团队揭开AI幻觉的真相

OpenAI团队的最新研究揭示了大语言模型产生幻觉的根本原因：AI就像面临难题的学生，宁愿猜测也不愿承认无知。研究发现，即使训练数据完全正确，统计学原理也会导致AI产生错误信息。更重要的是，现有评估体系惩罚不确定性表达，鼓励AI进行猜测。研究提出了显式置信度目标等解决方案，通过改革评估标准让AI学会诚实地说"不知道"，为构建更可信的AI系统指明方向。

至顶网科技行者 2025-09-24 13:57:14

让静态人像"开口说话"：Hedra公司推出MagicInfinite，用声音和文字让照片动起来

Hedra公司推出的MagicInfinite技术能够让静态人像照片"开口说话"，支持通过声音和文字双重控制生成高质量动态视频。该系统采用3D全注意力机制和两阶段训练方案，可处理各种风格人像（真实照片、动漫、艺术作品），实现精确的嘴唇同步。经过模型蒸馏优化后，生成速度提升20倍，10秒内可生成10秒视频。在用户测试中，91.33%的参与者认为其表现优于现有同类技术。

至顶网科技行者 2025-07-30 09:58:49

GPT-4也答不出，谁在《鹅鸭杀》里“刀”了那个虚拟主播

爱上一个虚拟偶像，从来就不是羞耻的事。

至顶网张晓迪 2023-03-21 15:09:09

AI也会"看图说话"了！上海交大团队让机器视觉推理能力提升12%

这项由上海交通大学与OPPO人工智能中心合作的研究首次深入探索了多模态大语言模型的视频空间推理能力提升方法。研究发现传统提示词对小型模型无效，转而采用GRPO强化学习训练法，构建了包含10万样本的VSI-100k数据集。最终，仅20亿参数的vsGRPO-2B模型性能提升12.1%并超越GPT-4o，证明了正确训练方法能够显著释放AI模型的空间理解潜力。

至顶网科技行者 2025-07-16 09:16:46

轻量级音乐AI新突破：国立台湾大学开发出参数更少但控制更精准的音乐生成技术

国立台湾大学等机构开发的MuseControlLite技术实现了音乐AI的重大突破。该系统仅用8500万参数就达到61.1%的旋律控制精度，比现有方法减少6.75倍参数量却性能更优。通过创新的位置编码和解耦交叉注意力机制，系统能同时处理文字、音乐属性和音频信号的多重控制，支持音乐生成、修复和风格迁移等功能，为音乐创作民主化开辟新道路。

至顶网科技行者 2025-07-01 09:56:27

公司研究-OpenAI：全球生成式AI领军者的崛起之路

从发展历程、核心技术、人才团队、商业模式等方面深度揭秘OpenAI。

至顶网至顶智库 2024-09-02 11:35:37

LLM循环助力：创建PARADEHATE数据集实现仇恨言论无毒化

这项研究创新性地利用大语言模型(LLM)代替人类标注者，创建了PARADEHATE数据集，用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美，随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示，在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异，证明LLM生成的数据可作为人工标注的高效替代方案，为创建更安全、更具包容性的在线环境提供了新途径。

至顶网科技行者 2025-06-05 18:02:59

记忆坚实的世界：斯坦福和上海交大研究团队为视频世界模型打造长期空间记忆

斯坦福大学和上海交大等机构的研究团队提出了一种为视频世界模型增加长期记忆能力的创新方法。受人类记忆机制启发，他们设计了三种互补的记忆系统：短期工作记忆、基于点云的长期空间记忆和稀疏情节记忆。这种组合允许AI在生成长视频时保持场景的空间一致性，解决了现有模型因有限上下文窗口导致的"遗忘"问题。实验表明，该方法在视角回忆一致性和整体视频质量方面显著优于现有技术，为创建持续一致的虚拟世界铺平了道路。

至顶网科技行者 2025-06-09 16:59:05

InternVL3.5：上海AI实验室的多模态AI新突破，让机器像人一样理解图文世界

上海AI实验室发布的InternVL3.5是新一代开源多模态大语言模型，能够同时理解图像和文字内容。该系统采用级联强化学习技术，推理性能提升16%，并通过视觉分辨率路由器实现4倍推理加速。在36项基准测试中表现优异，最大模型在多学科推理任务中得分77.7，接近商业模型水平，支持GUI交互、多语言处理等功能。

至顶网科技行者 2025-09-01 15:53:20

研究推理的奖励模型：微软提出新方法让AI评判能力更上一层楼

微软研究院新提出的"奖励推理模型"(RRM)为大型语言模型开创了全新评估方式。传统奖励模型对所有问题使用统一计算资源，而RRM能像人类一样先进行推理思考再做判断，对复杂问题投入更多思考资源。研究团队通过强化学习框架训练模型自主发展推理能力，无需显式示例。实验证明RRM在多个基准测试上表现优异，能自适应扩展计算资源提升判断准确性。该研究为AI评估系统带来范式转变，使人工智能判断更接近人类思考过程。

至顶网科技行者 2025-05-26 08:09:01

贝壳研究院32B模型突破：用开源数据打造推理能力媲美超大模型的"小巧强兵"

贝壳找房开发的AM-Thinking-v1是一个32B参数的推理优化语言模型，完全基于开源数据训练。该模型在数学推理和代码生成任务上表现出色，AIME2024得分85.3，超越了671B的DeepSeek-R1，证明了通过精心设计的训练流程，中等规模密集模型也能达到超大模型的推理能力。

至顶网科技行者 2025-07-09 11:56:44

三星SAIL实验室开发AI游戏制作神器：让电脑学会看着录像来改进自己做的游戏

三星SAIL实验室开发了一套AI游戏制作系统，包含评测器AVR-Eval和制作器AVR-Agent。系统能通过观看游戏录像来评判质量，并基于反馈不断改进游戏。测试显示该方法比一次性生成效果好79.2%，但AI目前还不能有效利用外部资源和反馈，展现了人机创作的根本差异。

至顶网科技行者 2025-08-07 11:10:49

电脑终于学会了像人类一样用键盘鼠标：ByteDance推出会玩游戏的AI助手

ByteDance Seed团队开发的UI-TARS-2是一个革命性的AI助手，能够通过观看屏幕并用鼠标键盘操作电脑，就像人类一样完成各种任务和游戏。该系统采用创新的"数据飞轮"训练方法，在多项测试中表现出色，游戏水平达到人类的60%左右，在某些电脑操作测试中甚至超越了知名AI产品，展现了AI从对话工具向真正智能助手演进的巨大潜力。

至顶网科技行者 2025-09-24 13:56:45

打破僵硬动作！南洋理工大学团队为人类视频补帧注入3D控制能力

南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI，一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程，解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息，并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集，包含2,614个视频片段及完整的人体标注。实验结果显示，PoseFuse3D-KI在PSNR上提升9%，LPIPS减少38%，显著超越现有方法。

至顶网科技行者 2025-06-07 09:52:35

亚马逊云科技推出Amazon Q：重塑未来工作方式

2023 年11月29日，亚马逊云科技在2023 re:Invent全球大会上推出Amazon Q，这是一种新型生成式AI支持的助手，专门用于满足办公场景需要，可以根据客户业务进行定制。

至顶网至顶网软件与服务频道 2023-11-29 17:25:02

亚马逊云科技推出Amazon Q：重塑未来工作方式

2023 年11月29日，亚马逊云科技在2023 re:Invent全球大会上推出Amazon Q，这是一种新型生成式AI支持的助手，专门用于满足办公场景需要，可以根据客户业务进行定制。

至顶网科技行者 2023-11-29 17:15:11