搜一下
用了 0.128659秒,为您找到
宝宝
计划
手机
软件
網纸
YB233
相关内容12593 条
“以科技之名,致敬攀登者”戴尔科技集团实力赋能企业数字化转型
2020戴尔科技峰会以“以科技之名,致敬攀登者”为主题,提出“科技至 · 新”、“科技至 · 简”、“科技至 · 远”的构想。
至顶网
至顶网存储频道 2020-11-18 13:22:07
视觉感知型RAG:通过强化学习和迭代推理赋能视觉丰富信息理解——来自阿里巴巴通义实验室和中科大的最新研究
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
至顶网
科技行者 2025-06-02 12:22:40
强强联手,共筑未来 Autodesk携手瑞云科技共筑CG行业新生态
正是在这样的发展趋势下,瑞云渲染作为亚洲前沿的云渲染平台,致力于为视觉行业提供专业可靠、安全稳定以及可持续创新的云渲染解决方案,助力推动视觉行业快速发展。
至顶网
业界供稿 2022-10-14 17:38:11
国网黑龙江电力ERP“上云” 看青云QingCloud全维云赋能行业数字化转型
在全新架构之下,青云QingCloud联手合作伙伴,为黑龙江电力提供一整套完善的ERP迁移与测试方案,顺利帮助黑龙江电力实现了ERP“上云”。
至顶网
李祥敬 2020-03-06 17:27:21
专家访谈:聊聊劳伦斯利弗莫尔国家实验室的EL CAPITAN系统与创新架构
近年来,世界各国的HPC大师们正纷纷转向超大规模与云设施领域。但不同于在供应商处任职,他们往往更倾向在自己熟悉的岗位上不断深耕。劳伦斯利弗莫尔国家实验室计算部门的首席技术官Bronis de Supinski就是其中之一。
至顶网
至顶网计算频道 2023-06-08 14:44:06
清华大学联合多校团队重磅发布:让自动驾驶汽车能看、能说、还能开——首份视觉-语言-行动模型全景调研
这是首份关于自动驾驶领域视觉-语言-行动模型的全景调研,由清华大学等多校团队完成。研究梳理了让汽车能看、能说、能开的VLA4AD技术发展历程,从早期语言解释器到最新推理增强系统的四个阶段,分析了20多个代表性模型,整理了相关数据集和评估方法,并指出了实时性能、安全验证、多模态融合等关键挑战和未来发展方向。
至顶网
科技行者 2025-07-18 09:36:47
对话开普勒胡德波:人形机器人不缺场景,缺的是“动手能力”
人形机器人早期落地,更依赖端侧小模型。
至顶网
金旺 2024-05-13 17:08:16
对话开普勒胡德波:人形机器人不缺场景,缺的是“动手能力”
人形机器人早期落地,更依赖端侧小模型。
至顶网
金旺 2024-05-13 17:22:13
SophiaVL-R1:为多模态大语言模型注入思维奖励,让AI推理能力更上一层楼
SophiaVL-R1是香港中文大学和上海人工智能实验室联合开发的多模态大语言模型,创新性地引入了"思维奖励"机制来提升AI的推理能力。与传统方法不同,该研究不仅关注AI是否得出正确答案,还评估整个思考过程的质量,通过Trust-GRPO算法智能地整合思维奖励和结果奖励。实验表明,即使只有7B参数,SophiaVL-R1也能在MathVista、MMMU等多个基准测试中超越参数量大10倍的模型,证明了思维过程监督对提升AI泛化推理能力的重要价值。
至顶网
科技行者 2025-05-28 08:09:15
要博更要渊:AMD深化EPYC服务器芯片发展路线图
我们也基本相信Genoa继任者与Turin处理器会继续与Genoa和Bergamo相同的SP5服务器插槽。否则如果每代都更改插槽,服务器制造商恐怕会承受不住。
至顶网
业界供稿 2021-11-12 09:28:55
为什么十个创业九个死
他们出生于互联网环境中,对拥抱新事物新技术充满热情,生成式人工智能的飞跃发展,也大大降低了创业的门槛。
至顶网
至顶网码客人生频道 2024-06-05 10:00:17
当电脑开始像人类一样思考:清华大学科学家如何让AI拥有"第六感"
清华大学研究团队在NeurIPS 2024上发表的System-2 Attention机制,为AI系统增加了类似人类深度思考的能力。该技术通过两阶段信息处理,让AI能够专注于关键信息而不被干扰因素误导,在复杂推理任务中表现显著提升。这项创新不仅解决了现有AI模型容易被无关信息分散注意力的问题,更为未来AI发展指明了从追求规模向提升思维质量转变的新方向。
至顶网
科技行者 2025-09-08 10:23:27
SenseFlow:香港科技大学团队突破性提升大规模文本生成图像模型的高效蒸馏技术
SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别器提升生成质量。实验表明,SenseFlow能将SD 3.5和FLUX等12B参数级模型成功蒸馏为仅需4步生成的高效版本,同时保持甚至超越原模型在多项指标上的表现,代表了AI图像生成效率提升的重要突破。
至顶网
科技行者 2025-06-06 09:18:07
IBM THINK演讲实录 | IBM Amy Wright:为您远程工作的员工赋能
转型之路道阻且长,要想实现劳动力数字化、提升员工体验、培养符合未来趋势的新技能以及永久改变我们的工作方式,我们还有许多工作要做。
至顶网
IBM 2020-06-12 19:16:07
腾讯等研究机构突破性进展:如何让AI模型从简单题目中"造"出更难题目来提升推理能力
腾讯等机构提出Composition-RL方法,通过将多个简单问题组合成复杂问题来提升大语言模型推理能力。该方法解决了AI训练中"太容易题目"无效的问题,在4B-30B参数模型上获得3-10%性能提升,特别是跨学科组合训练效果显著,为AI训练资源高效利用提供新思路。
至顶网
科技行者 2026-02-13 21:52:07
他是我遇到的最帅程序员——“超级小華”的码客人生
「许多人都不相信“超级小華”是一名程序员。」
至顶网
尼酱 2022-09-09 10:22:21
阿里巴巴研究团队突破多角色面部动画技术:让照片中的多个人物同时"活"起来
阿里巴巴集团高德地图团队与北京邮电大学合作开发的FantasyPortrait系统,实现了突破性的多人肖像动画技术。该系统采用隐式表情控制和遮罩交叉注意力机制,能够让静态照片中的多个人物同时展现不同的表情动作,在跨身份重现和多人协调动画方面显著优于现有方法,为影视制作、虚拟通信和游戏娱乐等领域带来革命性突破。
至顶网
科技行者 2025-07-23 19:04:22
沙特32B医疗AI突破:Gazal-R1凭借双阶段训练击败12倍大模型
沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
至顶网
科技行者 2025-07-01 15:53:37
CPGD:让语言模型的规则强化学习更稳定可靠
这项研究提出了CPGD算法,解决语言模型规则强化学习中的训练不稳定问题。通过用策略梯度损失替代PPO-clip损失,并引入裁剪机制和策略漂移正则化,CPGD有效避免了现有方法中由重要性采样比率引起的训练崩溃。实验结果表明,CPGD在多个多模态数学基准测试上显著优于其他强化学习算法,与基础模型相比平均提升11.0%的性能,尤其在领域内测试上提升21.8%,展现出卓越的稳定性和泛化能力。
至顶网
科技行者 2025-05-22 08:26:13
破解千兆光网确定性体验保障和变现难题,华为推全光自动驾驶网络方案2.0
在近期的华为全球分析师大会2021上,华为NCE传送接入领域总裁储涛发布了全光自动驾驶网络解决方案2.0,通过不断的产品功能迭代增强,持续提升对全光网络的超自动化、智能化水平,最终实现全光网络的自动驾驶。
至顶网
业界供稿 2021-04-16 15:27:37
<
上一页
596
597
598
599
600
601
602
603
604
605
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号