搜一下
用了 0.051100秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容3164 条
让语言模型流动起来:MediaTek Research团队研发的Latent Flow Transformer,通过流匹配压缩Transformer层数
MediaTek Research团队提出的Latent Flow Transformer(LFT)是一种创新架构,通过流匹配技术将多个Transformer层压缩为单层,大幅提升效率。研究引入"重耦合比率"指标精确预测适合压缩的层,并开发Flow Walking算法解决路径交叉问题。在Pythia-410M模型上,LFT成功将12层压缩为1层,其性能超过简单跳过3层的方法,缩小了自回归与基于流的生成方法之间的差距。这一技术不仅降低了模型参数量,还保持与原始架构兼容性,为大型语言模型的高效部署开辟了新途径。
至顶网
科技行者 2025-05-26 07:51:54
北京智源人工智能研究院发布首个大规模推理模型评测报告:AI思考越久越聪明的神话被打破
北京智源人工智能研究院发布首个大规模AI推理模型评测报告,通过全新数据集测试发现:当前最先进的推理模型存在思考过程与答案不一致、虚假声称使用外部工具、推理时间与视觉任务效果无关等问题。研究覆盖GPT-5、Gemini 2.5等数十个模型,揭示了AI推理能力的真实现状和安全隐患。
至顶网
科技行者 2025-10-13 09:01:24
ETH苏黎世大学提出OBR框架:让大模型既小巧又快速的神奇魔法
ETH苏黎世大学研究团队提出OBR(最优脑重建)框架,创新性解决了大语言模型压缩中量化与剪枝方法的根本冲突。通过"分组错误补偿"机制,OBR实现了W4A4KV4+50%稀疏性的极端压缩,在保持优秀性能的同时获得4.72倍速度提升和6.4倍内存节省,为边缘设备部署大模型开辟新道路。
至顶网
科技行者 2025-09-28 13:49:41
作为“水货”开发,我如何从月薪一千五“混”到两万
如果真把小韩当成“水货”,那可大错特错了。
至顶网
至顶网码客人生频道 2023-03-29 16:24:32
那个高升了的朋友突然约不出来了!
如何上云?这已经是各个企业CIO必须考虑的问题了。
至顶网
戴尔易安信 2018-07-20 18:32:06
清华大学团队开发"场景画家":让AI画出前所未有的3D世界之旅
清华大学研究团队开发出ScenePainter系统,能从单张照片生成连续一致的3D场景序列。该技术通过构建"场景概念图"解决了传统AI场景生成中的语义漂移问题,在保持视觉一致性的同时实现内容多样化。系统采用两阶段训练策略,用户测试显示其在质量、多样性和一致性方面均优于现有方法,为游戏、影视等领域提供了新的内容创作工具。
至顶网
科技行者 2025-08-05 10:34:50
技术布局与行业落地 NVIDIA让元宇宙触手可及
NVIDIA不断地探索、拓展Omniverse平台的应用,通过Omniverse这个巨大的生态连接平台推动工业数字孪生的发展。
至顶网
至顶网计算频道 2023-08-08 10:14:58
复旦大学团队揭秘:为什么给AI"喂"更多数据反而让它变笨了?
复旦大学研究团队通过对五个大型语言模型的深入分析,发现了AI训练中的一个反常现象:增加训练数据量不仅没有提升模型性能,反而导致最高14%的性能下降。研究揭示,精细调优过程中高达90%的参数更新对知识提升无效甚至有害,通过恢复这些无用参数可显著改善模型表现。这一发现挑战了"数据越多越好"的传统观念,为开发更高效的AI训练方法提供了新思路。
至顶网
科技行者 2025-09-30 09:06:34
Sci-Fi:对称约束让视频过渡更自然 - 北京大学等机构研究突破
这项由北京大学深圳研究生院、伟湾大学、腾讯ARC实验室和兔小贝智能联合研究的Sci-Fi框架,通过创新的对称约束机制,解决了视频帧间插值中的关键问题。研究团队设计了轻量级EF-Net模块,增强结束帧约束力,使其与起始帧形成平衡影响,从而生成更自然流畅的中间过渡帧。实验证明,该方法在各种场景下都优于现有技术,特别适用于电影制作、动画创作和视频编辑领域,显著降低了人力成本。
至顶网
科技行者 2025-05-30 17:25:27
进击的多模态推理:浙大&复旦联合研究团队揭秘从优化冷启动到分阶段强化学习的全新训练范式
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
至顶网
科技行者 2025-06-07 22:25:31
G1项目:Moonshot AI通过强化学习提升视觉语言模型的感知与推理能力
这篇研究介绍了Moonshot AI团队开发的G1模型,该模型通过强化学习显著提升了视觉语言模型在游戏环境中的决策能力。研究团队首创了VLM-Gym训练环境,包含多种视觉游戏与统一接口,并开发了两代模型:G0通过纯强化学习实现自我进化,G1则结合感知增强冷启动与强化学习,在所有游戏中超越教师模型。最关键的发现是感知和推理能力在学习过程中相互促进,为解决视觉语言模型的"知道-行动"差距提供了新方向。
至顶网
科技行者 2025-05-29 13:18:22
昇思MindSpore 1.8:丰富的算法集与套件,实现高性能训练,降低部署门槛
经过社区开发者们两个月来的不断努力,昇思MindSpore1.8版本现已发布。
至顶网
至顶网人工智能频道 2022-08-16 14:03:12
上海AI实验室重磅推出多模态奖励模型IXC-2.5-Reward:让AI更懂你的偏好
上海AI实验室推出的IXC-2.5-Reward是首个开源多模态奖励模型,能同时理解文本、图像和视频内容并评判AI回答质量。该模型在VL-RewardBench测试中达到70%准确率,超越所有开源模型,可用于AI训练优化、推理时最优选择和数据质量控制三大场景,为多模态AI发展提供了重要基础工具。
至顶网
科技行者 2025-09-16 11:09:29
计算机也能看图说话了?上海AI实验室发布视觉推理新突破
上海AI实验室发布视觉强化微调技术,让计算机学会"边看边思考"。该方法通过强化学习训练视觉模型先进行推理再给出答案,在少样本学习中表现优异,单样本图像分类准确率提升24.3%,物体检测精度提升超20分,在开放词汇检测等任务上也实现显著突破。
至顶网
科技行者 2025-08-01 14:44:44
TPTT:让AI大模型变身"记忆超人"的神奇技术
法国研究者提出TPTT框架,通过混合注意力机制和智能记忆管理,让现有AI大模型无需重训练就能获得超长文本处理能力。该技术在多个10亿参数模型上验证有效,Llama-3.2-1B精确匹配率提升20%,已开源供社区使用。
至顶网
科技行者 2025-06-27 09:33:47
香港大学团队打造"机器人眼中的世界":让AI学会像人类一样探索和思考
香港大学团队开发了EmbRACE-3K数据集,专门训练AI系统在复杂环境中进行推理和行动。该数据集包含超过3000个任务和26000个决策步骤,每步都有详细的推理标注。实验显示,现有先进AI模型在需要主动探索和环境交互的任务中表现不佳,成功率低于20%,但经过专门训练后性能显著提升。这项研究为开发更智能的服务机器人和自动驾驶系统提供了重要技术基础。
至顶网
科技行者 2025-07-22 09:25:53
深度学习黑匣问题迎来新发现,谷歌大牛Hinton说可能这就是答案
尽管所谓“深度神经网络”已经帮助机器学会如何利用自然语言进行交谈、驾驶汽车、游玩电子游戏并夺取围棋赛冠军,甚至绘制梦境、画画并推动科学发现,但其同时亦给创造者们带来新的挑战。
至顶网
CNET科技行者 2018-01-18 19:02:38
从呼噜声到语法:探索如何在合作觅食中产生语言 - A*STAR与南洋理工研究团队的突破性发现
这项由新加坡和英国研究机构联合进行的研究,使用多智能体强化学习探索了语言起源问题。研究团队设计了"觅食游戏"环境,让智能体在部分可观察的世界中协作完成任务。结果表明,智能体自发发展出具有人类语言五大特性的通信系统:任意性、互换性、位移性、文化传播和组合性。研究提供了关于语言如何在合作环境中自然演化的新见解,证明语言是从社会互动和共享目标中浮现的工具,而非孤立系统。
至顶网
科技行者 2025-05-23 07:42:55
CSVQA:中国团队打造超全面科学测评基准,挑战视觉语言模型的STEM推理能力
这篇研究介绍了CSVQA,一个专为评估视觉语言模型在STEM领域推理能力的中文多模态基准测试。该数据集包含1,378道涵盖物理、化学、生物和数学的问题,每题都要求模型分析科学图表并进行专业推理。实验评估了15种VLM,结果显示即使最强大的模型o1也仅达到49.6%的准确率,揭示了当前AI在科学推理方面的明显局限。研究还发现模型在不同学科表现不一,思维链提示效果因模型而异,为未来改进指明了方向。
至顶网
科技行者 2025-06-07 08:28:47
AI推理模型真的像宣传的那样聪明吗?Anthropic和Open Philanthropy研究人员揭露评测陷阱
Anthropic和Open Philanthropy研究人员发现,之前声称AI推理模型存在"准确率崩溃"的研究实际上混淆了推理能力和物理限制。通过重新分析发现,AI模型在遇到输出长度限制时会主动停止,而非推理失败;部分测试题目本身无解却被当作失败案例;改用程序生成方式后,模型在复杂问题上表现出色,揭示了AI评估方法的重要缺陷。
至顶网
科技行者 2025-06-18 17:44:59
<
上一页
129
130
131
132
133
134
135
136
137
138
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号