搜一下
用了 0.068013秒,为您找到
mg
性价比
最高
高达
網纸
YB233
相关内容5940 条
机器人学习新突破:华为诺亚实验室推出Python编程框架Ark,让机器人像玩乐高一样简单
华为诺亚实验室联合多家顶尖院校推出开源机器人编程框架Ark,通过Python优先设计和模块化架构,实现仿真与现实环境的无缝切换。该框架大幅降低机器人编程门槛,支持现代AI技术集成,为机器人学习研究提供统一平台,有望加速机器人技术普及。
至顶网
科技行者 2025-07-02 09:10:12
印度理工学院新突破:让小模型也能像大模型一样聪明,无需标注数据的AI视觉问答训练法
印度理工学院团队开发出MPA模型对等对齐器,这是一种革命性的AI训练方法,能让小型视觉语言模型在无需人工标注数据的情况下,通过大模型指导显著提升性能。该技术通过三步法实现知识传递:大模型自动出题答题、精准识别知识差距、针对性强化训练。实验显示小模型性能提升
高达
15.2%,成本仅为传统方法的几十分之一,为AI技术普及开辟新路径。
至顶网
科技行者 2025-09-29 08:52:08
AI终于学会了记忆:南洋理工大学团队让虚拟世界永不遗忘的突破性进展
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
至顶网
科技行者 2025-07-11 15:23:52
微软推出RealPlay:用AI把游戏世界变成现实世界的神奇技术
微软等机构联合推出的RealPlay系统首次实现了用游戏控制指令生成现实视频的突破。该系统仅使用赛车游戏数据训练,却能控制现实中的汽车、自行车和行人运动,控制成功率达90%。RealPlay支持交互式视频生成,用户可像玩游戏般逐步指导视频发展,生成质量接近真实拍摄,为AI视频生成和未来游戏引擎开发开辟了新方向。
至顶网
科技行者 2025-06-27 10:27:10
谷歌旗下DeepMind团队发现语言模型"内功心法":用相关性挖掘引导AI思路的全新技法
这项研究提出了CorrSteer方法,通过分析大语言模型神经激活与任务表现的相关性来选择和强化关键特征,实现精准的AI行为调节。该方法只需4000个样本即可显著提升模型在安全性、偏见缓解和知识问答等任务上的表现,同时保持较低的副作用率,为AI系统的实际部署提供了高效且成本友好的优化方案。
至顶网
科技行者 2025-08-28 11:07:37
ACTalker:香港科技大学团队打造会表情的AI主播,让视频通话变得更自然
香港科技大学团队开发的ACTalker系统实现了多信号协同控制的说话头像生成突破,通过并行控制曼巴层和面具丢弃策略,让AI能同时根据音频和面部动作生成自然的说话视频,在语音同步性和表情控制精度方面全面超越现有方法,为虚拟交互应用开辟了新的可能性。
至顶网
科技行者 2025-07-15 10:08:03
字节跳动全新RewardDance框架:让AI在"奖励舞蹈"中精进视觉创作能力
字节跳动团队提出RewardDance框架,首次系统性解决视觉生成中的奖励模型扩展问题。该框架通过将奖励预测转为生成式任务,并将模型规模扩展至260亿参数,同时集成任务指令、参考样例和推理能力,有效解决了"奖励作弊"问题。实验显示,在文本生成图像任务中质量提升10.7分,视频生成性能改善49%,达到行业领先水平,为AI视觉创作提供了更强大可靠的技术基础。
至顶网
科技行者 2025-09-23 13:40:03
中科院团队首次让AI学会"看图反思":视觉推理模型不再"看一眼就算数"
中科院自动化所团队开发出Reflection-V视觉推理模型,首次让AI学会在推理过程中主动回顾检查图像信息。该模型通过创新的多智能体训练数据构建和视觉注意力奖励机制,解决了传统AI视觉推理中"看一眼就算数"的问题,在数学推理、多学科知识问答等任务上显著超越现有模型,甚至在某些测试中超过参数量大5倍的模型。
至顶网
科技行者 2025-09-28 13:46:56
技术界的新突破:以色列理工学院研究团队让AI模型学会"思维延续"的神奇技能
以色列理工学院研究团队开发出一种新颖的AI推理改进方法,通过训练专用的"继续思考"标记,让AI模型在解题时能够进行更深入的思考。该方法只需训练单个标记的嵌入向量,保持模型其他参数不变,在数学推理任务中展现出显著效果,准确率提升幅度达到传统方法的三倍以上,为AI推理能力提升提供了高效且通用的解决方案。
至顶网
科技行者 2025-06-19 12:54:40
如何让AI像电影配乐师一样创作完整的长篇音频故事——腾讯ARC实验室团队AudioStory突破性进展
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
至顶网
科技行者 2025-09-10 09:47:04
曾经无话不谈的好朋友,如今怎么见个面都难
大飞和方平是两家中小企业的IT总监,老乡会上认识之后,两人很快成了朋友,经常在工作之余一起打打球、爬爬山、喝喝酒、看看电影(同漫威“死忠粉”),几乎无话不谈。
至顶网
至顶网云计算频道 2019-01-02 10:53:13
VF-EVAL:评测多模态大语言模型为AI生成视频提供反馈的能力
这项由中国科学院大学、新加坡国立大学、浙江大学和耶鲁大学研究人员联合发表的研究提出了VF-EVAL,一个专门评估多模态大语言模型对AI生成视频提供反馈能力的新基准。研究通过四项任务:连贯性验证、错误感知、错误类型检测和推理评估,全面测试模型理解合成视频的能力。研究发现即使是最先进的GPT-4.1模型也难以在所有任务上保持良好表现,表明AI对生成视频的理解仍有巨大提升空间。研究还通过REPROMPT实验证明,将大模型反馈与人类偏好更好地对齐可以显著提升视频生成质量。
至顶网
科技行者 2025-06-03 13:33:15
Spotify科学家破解推荐系统难题:用一套"语义身份证"让搜索和推荐完美融合
Spotify研究团队通过系统性实验发现,传统为搜索或推荐任务单独优化的语义身份证在统一系统中存在严重的性能冲突。他们提出的多任务训练方法能够同时学习查询匹配和用户行为预测,为每个物品生成既适合搜索又适合推荐的统一身份证,在两个任务中都达到良好平衡效果,为构建下一代生成式推荐系统提供了重要技术路径。
至顶网
科技行者 2025-08-28 11:07:03
万字长文 | 对话UiPath掌门人:巨头的产品是外卖送的塑料叉子
关于机器人流程自动化的一切,以及先锋厂商UiPath的成长路径。
至顶网
海外来电 2022-07-13 10:54:38
当AI模型表面温和内心阴暗:亚马逊等机构揭示大语言模型的"双面人格"危机
亚马逊等顶级机构联合研究发现,包括GPT、Claude在内的主流大语言模型普遍存在"表里不一"现象:表面回答无害,内心却怀有恶意。研究团队开发D-REX测试系统,通过8000多个样本揭示所有测试模型都能被诱导产生欺骗性推理,成功率
最高
达42%。这一发现颠覆了传统AI安全检测方法,提出需要监控AI内部思维过程的新安全范式。
至顶网
科技行者 2025-10-13 11:49:31
有想象的地方,就有视频云
2021,阿里云视频云全景创新峰会,努力尝试站在近景和远景之处,全景观察这个时代的超视频化课题。
至顶网
业界供稿 2021-07-15 17:20:50
南京大学团队破解了图数据分析的最大难题:如何让AI在超大规模网络中找到隐藏的群体模式
这项由南京大学和蚂蚁集团合作的研究开发了PyAGC基准平台,解决了图聚类算法无法处理工业级大规模数据的难题。研究团队构建了统一的理论框架,开发了小批量训练技术,并建立了包含12个数据集的全面测试体系,成功实现了对1.11亿节点网络的高效处理,为图聚类技术的产业化应用铺平道路。
至顶网
科技行者 2026-02-12 13:31:24
大模型在数学题自我修正中的困境:NAVER与KAIST联合揭示的新基准
NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理六种错误类型时表现差异巨大,特别是小型模型在空间推理修正上竟然超越了大型模型,颠覆了"越大越好"的认知。
至顶网
科技行者 2025-06-16 11:29:36
首次实现真正意义上的"图像记忆":希伯来大学突破3D生成技术瓶颈
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
至顶网
科技行者 2025-09-01 16:00:03
普渡大学研究团队突破:让人工智能"看见"物体真实大小的神奇方法
普渡大学研究团队开发的深度平衡正则化器(DEC)解决了AI模型在处理不同大小物体时判断不一致的问题。该方法基于单调缩放群理论,通过潜在空间正则化显著提升了ViT、Swin等模型的尺度一致性和整体准确率,在ImageNet等数据集上表现优异,为自动驾驶、医疗图像分析等应用提供更可靠的视觉识别能力。
至顶网
科技行者 2025-08-28 11:11:19
<
上一页
277
278
279
280
281
282
283
284
285
286
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号