搜一下
用了 0.314338秒,为您找到
彩神
v
怎么
分析
網纸
YB233
相关内容16936 条
Meta携手NYU突破多模态训练边界:AI模型首次实现文本和视觉的真正统一
Meta AI与纽约大学研究团队通过创新的Transfusion框架,首次实现了文本和视觉的真正统一训练。研究发现,使用表示自编码器作为统一视觉表示,配合专家混合架构,不仅消除了模态间的竞争,还产生了协同效应。模型自发获得世界建模能力,能理解自然语言指令并预测物理动作结果。实验揭示了视觉学习比语言学习更加数据饥渴的规律,为未来大规模AI系统设计提供了重要指导。
至顶网
科技行者 2026-03-04 15:01:14
V
iStoryBench:一场可视化故事世界的大冒险——StepFun团队打造全面评估标准,帮你判断AI是否真懂讲故事
V
iStoryBench是一个全面的故事可视化评估基准,由StepFun团队打造,用于测试AI将文字故事转化为连贯图像序列的能力。它包含80个多样化故事和344个角色参考,评估包括角色一致性、提示遵循度等多个维度。研究测试了20多种方法,发现UNO在开源方法中表现最佳,而商业软件如豆包和GPT-4o在提示一致性方面表现突出。该基准为故事可视化研究提供了统一标准,推动这一领域的创新发展。
至顶网
科技行者 2025-07-07 17:38:18
阿里巴巴推出GSPO:让AI大模型训练不再"崩盘"的革命性算法
阿里巴巴通义千问团队推出GSPO算法,解决了大型语言模型强化学习训练中的稳定性问题。该算法改变传统逐词优化方式,采用序列级重要性权重和截断机制,显著提高训练效率和稳定性,特别适用于专家混合模型训练,已成功应用于Qwen3模型并取得显著性能提升。
至顶网
科技行者 2025-07-29 17:15:41
华科大联手地平线:让AI学会开车的秘诀,竟然是在数字世界里"碰车"
华中科技大学联合地平线机器人开发RAD自动驾驶训练系统,首次将3D高斯点云渲染技术应用于强化学习,在逼真虚拟环境中让AI通过试错学习驾驶技能。该方法巧妙结合模仿学习与强化学习,将碰撞率降低3倍至8.9%,同时保持人类化驾驶风格。研究为自动驾驶AI安全训练开辟新路径,预示更可靠的无人驾驶汽车即将到来。
至顶网
科技行者 2025-08-21 10:02:27
2022华为全球
分析
师大会:聚集当下和未来进行创新
华为第19届全球
分析
师大会在深圳开幕。
至顶网
至顶网物联网频道 2022-04-26 17:22:03
中央政法工作会议:要研究无人驾驶、人工智能、虚拟货币、数据权属等新问题,通过立法规范平台行为、加强新就业群体合法权益保护
这次中央政法工作会议的主要任务是:坚持以习近平新时代中国特色社会主义思想为指导,深入贯彻党的二十大和二十届二中、三中全会精神,深入贯彻习近平总书记对政法工作的重要指示和中央经济工作会议、二十届中央纪委四次全会精神,总结工作,
分析
形势,研究部署2025年政法工作。
至顶网
清华大学智能法治研究院 2025-01-20 11:04:32
Labelbox团队的AI智能代理新突破:理解用户真正需要什么
Labelbox团队开发了隐式智能评估框架,专门测试AI代理理解用户隐含需求的能力。研究发现,即使最先进的AI模型也只有48.3%的成功率,在理解人类交流的微妙之处方面仍有很大提升空间。该研究为AI从简单执行指令向真正理解用户意图的转变提供了重要指导。
至顶网
科技行者 2026-03-03 11:38:25
CPU、GPU、FPGA、AI芯片,各种XPU哪家强?一篇文章看懂芯片产业格局
展望未来,XPU市场将呈现百花齐放的局面,各种芯片在各自的赛道发挥自身独特的价值。同时各种计算架构之间在聚焦自身优势的同时,也在相互融合协同,形成了“你中有我,我中有你”的局面。
至顶网
李祥敬 2021-07-07 09:07:32
大语言模型在"混合语言"面前的尴尬:MBZUAI揭示AI理解多语言混用文本的真实水平
MBZUAI和巴黎综合理工学院研究团队系统评估了大语言模型对混合语言文本的理解能力,发现当英语中混入其他语言时模型性能下降,但其他语言中混入英语时性能反而提升,揭示了AI系统的语言偏见问题,并提出了通过专门训练改善的有效方案。
至顶网
科技行者 2025-06-27 11:43:59
CES2020观察:足够“硬核” 看各大电视厂商如何争奇斗艳
作为每年的生活,CES肯定少不了电视厂商的参与,今年也不例外。不管是国内的电视厂商还是国际的大厂,无不“八仙过海各显神通”。首先我们看下今年的CES电视厂商的关键词。
至顶网
李祥敬 2020-01-09 23:58:39
Nebius团队:让AI更快回答的新招数——像教练一样训练"小助手"
这项由Nebius公司进行的研究提出了LK损失训练方法,用于优化AI推理加速中的"投机解码"技术。传统方法让小助手模型模仿大模型行为,但LK方法直接优化猜测成功率。实验显示该方法在多种模型架构上都能提升0.5%-8.2%的性能,特别是对能力有限的小模型效果更佳。该技术可直接替代现有训练方法,无需额外计算开销。
至顶网
科技行者 2026-03-05 15:14:19
清华大学新突破:让AI在虚拟世界中拥有"持久记忆",告别视频生成中的"失忆症"
清华大学研究团队提出
V
iewRope技术,解决AI视频生成中的空间一致性问题。该技术让AI理解真实观察方向而非仅依赖屏幕坐标,配合几何感知稀疏注意力机制,使AI能在重访同一位置时生成一致内容。实验显示该方法显著降低了回环错误率,为创建具备持久空间记忆的交互式虚拟世界奠定基础。
至顶网
科技行者 2026-02-26 09:47:57
做“元宇宙里的牛顿”,心咚科技脚下也站着“巨人”
如果某天,一个15岁的稚嫩少年问你“想不想和我们一起超越微软?”你会作何反应?
至顶网
高玉娴 2021-12-30 14:16:42
中国黑客关系图
「 天下风云出我辈,一入江湖岁月催。皇图霸业谈笑中,不胜人生一场醉。今日推荐 雷锋网(id:leiphone-sz)一篇文章。袁哥、沈继业、冰河、杨冀龙、杨勇、方兴、江海客、季昕华、黑哥……致敬网安领域的时代先驱们。」
至顶网
至顶网码客人生频道 2022-09-26 11:43:02
程序员的时代红利快消失了,我要抓住它
人人都在焦虑中奋力奔跑。在知乎上,有人唱衰互联网大厂,有人问现在成为程序员是不是晚了,有人说35岁后的程序员都去哪了?这些问题一直热议不断。
至顶网
2 0 社 2022-03-10 18:29:31
东北大学团队突破文本人物搜索技术:让机器像人一样"看懂"人物描述
这项研究通过创新的梯度注意力机制和500万张图片的WebPerson数据集,显著提升了文本描述人物检索的准确性。GA-DMS框架能智能识别描述中的关键词汇,过滤噪声干扰,在标准测试中达到77.6%的准确率,为安防监控、人员搜寻等应用提供了重要技术支撑。
至顶网
科技行者 2025-09-12 16:48:47
芯片行业王者之战:Arm发布其架构的第九个版本
就在新任首席执行官Pat Gelsinger宣布英特尔公司的重塑计划正好一周之后,Arm发布了其架构的第九个版本,并且提出了该公司对下一个十年的愿景。
至顶网
siliconANGLE 2021-04-07 09:04:12
AniMaker:哈工大深圳团队让电脑变身动画导演,一句话就能拍出多角色动画片
这项由哈工大深圳与阿里巴巴联合研发的AniMaker系统,能够仅凭文字描述自动制作多角色动画片。系统采用四个AI智能体协作模式,模拟专业动画制作流程,引入蒙特卡洛树搜索算法优化视频片段选择,并首创AniE
v
al动画专用评价体系。实验显示该系统在各项评价指标上均超越现有方法,为AI创意应用开辟新方向。
至顶网
科技行者 2025-06-18 09:54:44
这家创业公司,如何让无数海外房东开成民宿酒店?
出海开一家靠谱的民宿酒店需要几步?
至顶网
周雅 2024-04-25 11:54:44
告别参照系困扰:上海AI实验室团队让3D重建摆脱"偏心眼"
这项研究提出了π?方法,通过置换等变架构解决了传统3D重建技术依赖固定参照系的问题。该方法让每个摄像机独立描述场景,无论输入顺序如何都能产生一致结果,在多个任务上达到最先进性能,同时具有出色的鲁棒性、可扩展性和训练效率,为AR、自动驾驶等应用领域带来新可能。
至顶网
科技行者 2025-07-24 10:45:32
<
上一页
831
832
833
834
835
836
837
838
839
840
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号