搜一下
用了 0.055265秒,为您找到
mg
性价比
最高
高达
網纸
YB233
相关内容5680 条
2023CSDI算力+智能:数字时代的进化升级
在未来的产业布局中,云网融合、软硬一体化,硬件智能化、软件的泛化以及数据无处不在,基本是未来的趋势。
至顶网
业界供稿 2023-05-18 21:43:02
清华大学突破性研究:让AI像人眼一样实时"看懂"动态世界
清华大学团队开发的StreamVGGT实现了首个实时4D视觉几何重建系统,通过模仿人类视觉的时间因果感知机制,将处理速度提升30倍而精度几乎不变。该技术采用流式处理架构和知识蒸馏训练,为自动驾驶、AR/VR、机器人导航等领域提供了突破性解决方案。
至顶网
科技行者 2025-07-25 09:36:49
视觉赋能大脑:让多模态大语言模型在真实空间中看见、思考与控制
这项由上海人工智能实验室等机构联合发布的研究提出了VeBrain框架,成功解决了多模态大语言模型在现实世界应用中的关键挑战。VeBrain通过将机器人控制重新定义为2D视觉空间中的文本任务,统一了多模态理解、视觉空间推理和物理控制三大能力。研究团队还创建了包含60万条高质量指令数据的VeBrain-600k数据集,并设计了创新的机器人适配器将模型决策转化为实际运动。实验结果表明,VeBrain在13个多模态基准和5个空间智能基准上表现优异,并在实际机器人应用中展示出强大的适应性和组合能力。
至顶网
科技行者 2025-06-06 17:29:14
让AI看图说话更详细更准确:上海人工智能实验室团队开发的ScaleCap技术突破
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。
至顶网
科技行者 2025-06-27 17:00:35
机器人学习新突破:华为诺亚实验室推出Python编程框架Ark,让机器人像玩乐高一样简单
华为诺亚实验室联合多家顶尖院校推出开源机器人编程框架Ark,通过Python优先设计和模块化架构,实现仿真与现实环境的无缝切换。该框架大幅降低机器人编程门槛,支持现代AI技术集成,为机器人学习研究提供统一平台,有望加速机器人技术普及。
至顶网
科技行者 2025-07-02 09:10:12
AI终于学会了记忆:南洋理工大学团队让虚拟世界永不遗忘的突破性进展
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
至顶网
科技行者 2025-07-11 15:23:52
微软推出RealPlay:用AI把游戏世界变成现实世界的神奇技术
微软等机构联合推出的RealPlay系统首次实现了用游戏控制指令生成现实视频的突破。该系统仅使用赛车游戏数据训练,却能控制现实中的汽车、自行车和行人运动,控制成功率达90%。RealPlay支持交互式视频生成,用户可像玩游戏般逐步指导视频发展,生成质量接近真实拍摄,为AI视频生成和未来游戏引擎开发开辟了新方向。
至顶网
科技行者 2025-06-27 10:27:10
谷歌旗下DeepMind团队发现语言模型"内功心法":用相关性挖掘引导AI思路的全新技法
这项研究提出了CorrSteer方法,通过分析大语言模型神经激活与任务表现的相关性来选择和强化关键特征,实现精准的AI行为调节。该方法只需4000个样本即可显著提升模型在安全性、偏见缓解和知识问答等任务上的表现,同时保持较低的副作用率,为AI系统的实际部署提供了高效且成本友好的优化方案。
至顶网
科技行者 2025-08-28 11:07:37
ACTalker:香港科技大学团队打造会表情的AI主播,让视频通话变得更自然
香港科技大学团队开发的ACTalker系统实现了多信号协同控制的说话头像生成突破,通过并行控制曼巴层和面具丢弃策略,让AI能同时根据音频和面部动作生成自然的说话视频,在语音同步性和表情控制精度方面全面超越现有方法,为虚拟交互应用开辟了新的可能性。
至顶网
科技行者 2025-07-15 10:08:03
技术界的新突破:以色列理工学院研究团队让AI模型学会"思维延续"的神奇技能
以色列理工学院研究团队开发出一种新颖的AI推理改进方法,通过训练专用的"继续思考"标记,让AI模型在解题时能够进行更深入的思考。该方法只需训练单个标记的嵌入向量,保持模型其他参数不变,在数学推理任务中展现出显著效果,准确率提升幅度达到传统方法的三倍以上,为AI推理能力提升提供了高效且通用的解决方案。
至顶网
科技行者 2025-06-19 12:54:40
曾经无话不谈的好朋友,如今怎么见个面都难
大飞和方平是两家中小企业的IT总监,老乡会上认识之后,两人很快成了朋友,经常在工作之余一起打打球、爬爬山、喝喝酒、看看电影(同漫威“死忠粉”),几乎无话不谈。
至顶网
至顶网云计算频道 2019-01-02 10:53:13
VF-EVAL:评测多模态大语言模型为AI生成视频提供反馈的能力
这项由中国科学院大学、新加坡国立大学、浙江大学和耶鲁大学研究人员联合发表的研究提出了VF-EVAL,一个专门评估多模态大语言模型对AI生成视频提供反馈能力的新基准。研究通过四项任务:连贯性验证、错误感知、错误类型检测和推理评估,全面测试模型理解合成视频的能力。研究发现即使是最先进的GPT-4.1模型也难以在所有任务上保持良好表现,表明AI对生成视频的理解仍有巨大提升空间。研究还通过REPROMPT实验证明,将大模型反馈与人类偏好更好地对齐可以显著提升视频生成质量。
至顶网
科技行者 2025-06-03 13:33:15
Spotify科学家破解推荐系统难题:用一套"语义身份证"让搜索和推荐完美融合
Spotify研究团队通过系统性实验发现,传统为搜索或推荐任务单独优化的语义身份证在统一系统中存在严重的性能冲突。他们提出的多任务训练方法能够同时学习查询匹配和用户行为预测,为每个物品生成既适合搜索又适合推荐的统一身份证,在两个任务中都达到良好平衡效果,为构建下一代生成式推荐系统提供了重要技术路径。
至顶网
科技行者 2025-08-28 11:07:03
万字长文 | 对话UiPath掌门人:巨头的产品是外卖送的塑料叉子
关于机器人流程自动化的一切,以及先锋厂商UiPath的成长路径。
至顶网
海外来电 2022-07-13 10:54:38
有想象的地方,就有视频云
2021,阿里云视频云全景创新峰会,努力尝试站在近景和远景之处,全景观察这个时代的超视频化课题。
至顶网
业界供稿 2021-07-15 17:20:50
大模型在数学题自我修正中的困境:NAVER与KAIST联合揭示的新基准
NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理六种错误类型时表现差异巨大,特别是小型模型在空间推理修正上竟然超越了大型模型,颠覆了"越大越好"的认知。
至顶网
科技行者 2025-06-16 11:29:36
普渡大学研究团队突破:让人工智能"看见"物体真实大小的神奇方法
普渡大学研究团队开发的深度平衡正则化器(DEC)解决了AI模型在处理不同大小物体时判断不一致的问题。该方法基于单调缩放群理论,通过潜在空间正则化显著提升了ViT、Swin等模型的尺度一致性和整体准确率,在ImageNet等数据集上表现优异,为自动驾驶、医疗图像分析等应用提供更可靠的视觉识别能力。
至顶网
科技行者 2025-08-28 11:11:19
如何成为技术大佬?——一个程序员的蜕变之路
人生的道路虽然漫长,但紧要处就那么几步,特别是在年轻的时候。
至顶网
尼酱 2022-06-16 15:50:32
专访|DoorDash掌门人:从濒临倒闭到主宰美国外卖市场,如何缔造一个全新商业帝国
DoorDash联合创始人兼CEO Tony Xu(徐讯)与YC董事长Garry Tan展开了一场关于创业精髓的访谈,讲述了公司的起源故事、公司如何在几次危机中幸存下来、以及如何改变整个行业。
至顶网
周雅 2025-04-09 21:22:44
智谱AI和清华大学联手打造GLM-4.1V-Thinking:让AI像人类一样深度思考的神奇模型
智谱AI和清华大学联合发布GLM-4.1V-Thinking视觉语言模型,通过创新的推理导向训练框架,让AI学会像人类一样深度思考后再回答。该模型在多个基准测试中超越了规模更大的竞争对手,并首次在开源社区提供了完整的多模态推理解决方案,为AI技术的实际应用开辟了新路径。
至顶网
科技行者 2025-07-03 14:00:35
<
上一页
268
269
270
271
272
273
274
275
276
277
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号