搜一下
用了 0.024331秒,为您找到
准确率
最高
计划
软件
罔芷
88pkee
驻测
相关内容1363 条
一招制胜:通过单一问题的批评式微调释放大语言模型的推理潜力
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
至顶网
科技行者 2025-06-07 22:25:15
从机器人感知到智能理解:UC伯克利推出Robo2VLM,利用真实机器人操作数据训练视觉语言模型
UC伯克利研究团队开发了Robo2VLM,一个创新框架,利用真实机器人操作数据增强视觉语言模型的空间推理能力。该研究从176K真实机器人轨迹创建了一个包含684,710个问题的大规模VQA数据集,涵盖463个场景和3,396个操作任务。实验表明,这些数据可显著提升模型在空间关系理解、目标推理和物理交互方面的能力,为机器人与AI系统的融合开辟新方向。
至顶网
科技行者 2025-05-28 07:40:43
阿里云Serverless 容器服务全面升级:新增组件全托管、AI镜像秒级拉取能力
6 月 1 日在阿里云粤港澳大湾区云峰会上,阿里云智能云原生应用平台总经理丁宇宣布,Serverless 容器服务 ASK全面升级,进一步帮助企业和开发者降本提效。
至顶网
业界供稿 2023-06-02 15:41:39
蘑菇车联月语音交互次数已突破3亿次
“目前,我们月语音交互次数已突破3亿次。”现场,蘑菇车联副总裁张磊公布了蘑菇车联最新语音交互数据,“蘑菇车联始终以用户体验为核心,通过大量的数据分析理解用户需求,并基于真实应用场景不断优化用户体验,为用户提供更主动、更精准、更体贴的服务。”
至顶网
业界供稿 2019-08-09 21:45:53
思考到什么时候为好?美团AI研究团队提出自适应思考模式切换方法,让大型推理模型更高效
这篇论文介绍了美团研究团队开发的"自适应自恢复推理"(ASRR)框架,解决了大型推理模型在简单问题上过度思考的效率问题。研究发现模型具有"内部自恢复机制",能在生成答案时隐式补充推理。ASRR通过无思考模式抑制不必要推理,并引入基于
准确率
阈值的动态长度惩罚,使模型根据问题难度自适应分配推理资源。实验表明,ASRR在保持高
准确率
的同时,大幅减少了推理长度(
最高
减少32.5%),并显著提升了安全性(无害率提高21.7%)。
至顶网
科技行者 2025-05-27 16:58:58
知乎再优化社区管理机器人“瓦力”,挑战反讽语言暴力难题
6月23日-24日,知乎以“阴阳怪气”为主题办了一场书法展。据知乎社区治理团队介绍,接下来知乎“瓦力”机器人将上线“阴阳怪气”(反讽语言)识别功能,通过对用户行为数据的分析、学习,基于语义和用户关系进行更深层次的理解和建模。
至顶网
高玉娴 2018-06-26 12:34:02
让AI自己与自己对抗:清华港大联合研究团队提出SPC框架,不需人工标注也能评估大模型推理步骤
想象一下,你正在学习解数学题,老师不仅关心你的最终答案是否正确,更关心你的解题过程中每一步是否合理。在人工智能领域,大型语言模型(LLM)也面临类似的情况。最近几年,像o1、R1和QwQ这样的大模型在解决复杂问题时,会使用一种叫"思维链"(Chain-of-Thought,简称CoT)的方法,就像人类一步一步思考问题一样。
至顶网
科技行者 2025-04-30 13:37:07
Amazon最新 AI 工具旨在优化产品列表
亚马逊推出的“Enhance My Listing”工具,利用生成式 AI 自动为商品标题、属性及描述提供更新建议,目前在美国部分商家试用,未来将逐步推广。
至顶网
Techcrunch 2025-05-09 09:53:44
大数据知识vs人际互动:研究发现LLM的医学专业知识在人机交互中大打折扣
想象一下,你有一个医学问题,但附近没有医生可以咨询。如今,你可能会打开手机,向ChatGPT这样的AI助手寻求建议。这个场景正在全球范围内变得越来越常见。实际上,调查显示,每六个美国成年人中就有一个每月至少使用AI聊天机器人一次来获取健康信息。
至顶网
科技行者 2025-04-30 11:52:39
德比
软件
:酒店库存预测
准确率
提高20%,多亏AI这个幕后功臣
在预订酒店时你更愿意用携程,还是更愿意用booking.com?其实不管通过哪家平台预定成功,德比
软件
都有可能会从中获得一笔小额的订单费,这也是因为其架设了一条OTA与酒店间的互联网高速公路,建立起联系全球旅行社和酒店的互联网预订体系。
至顶网
王聪彬 2020-09-22 15:24:40
共同进化的魔法:让AI既会写代码又会检验代码,一个团队让计算机学会自我完善的故事
这项研究提出了CURE框架,通过强化学习让大语言模型同时学习编写代码和生成单元测试两种能力,无需使用标准代码作为监督。团队开发的ReasonFlux-Coder模型在仅用4.5K编程问题训练后,便在多个基准测试中超越了同类模型,代码生成
准确率
提高5.3%,最佳N选1
准确率
提高9.0%。该方法不仅提升了模型性能,还提高了推理效率,同时为降低API调用成本和无标签强化学习提供了新思路。
至顶网
科技行者 2025-06-06 14:15:25
锐捷推出新一代AI SaaS 云平台,支撑百万级智能柜规模化运营
近日,ICT基础设施及行业解决方案提供商锐捷网络发布新一代AI SaaS 云平台解决方案。
至顶网
业界供稿 2021-07-01 15:41:39
数据泄露之殇 给安全演进带来了哪些新的思考
数据泄露对个人和企业来说其危害都将是十分深远的。那么,我们今天的企业对数据安全的重视程度是不是已经有所加强了呢?答案是有加强,但还远远不够。也是在这样的情况下,促使目前很多安全厂商开始把产品重心转移到数据安全方向上来。
至顶网
李超 2019-02-22 16:52:08
有意见 | 60s预测10天天气,气象的“钥匙”也要交给AI了?
古时便有夜观天象,而今随着科技发展,AI越来越多地参与到了天气预报行业中。
至顶网
至顶网有意见频道 2023-01-03 17:07:09
锐捷推出新一代AI SaaS 云平台,支撑百万级智能柜规模化运营
近日,ICT基础设施及行业解决方案提供商锐捷网络发布新一代AI SaaS 云平台解决方案。该方案是为适应日益普及的无人零售这一业态,基于先进的人工智能视觉识别技术,不仅可以使智能货柜在成本、业务指标上都达到运营级别,还可以支撑百万级智能柜的高精准…
至顶网
至顶网网络与安全频道 2021-07-06 18:16:09
当变形金刚遇上"顿悟":德国慕尼黑工业大学研究团队揭示如何让AI从死记硬背到真正理解
想象你正在玩一个侦探游戏。你手里有几条零散的线索:"奥巴马的妻子是米歇尔"、"米歇尔出生于1964年"、"《欢乐满人间》电影上映于1964年"。现在有人问你:"与奥巴马妻子出生同年上映的电影是什么?"要回答这个问题,你需要将多条线索串联起来,从奥巴马→他的妻子→她的出生年份→该年份上映的电影,最终得出答案。
至顶网
科技行者 2025-05-07 10:24:01
中科三清空气质量预报模式项目荣获2017年度国家科技进步二等奖
1月8日,2017年度国家科学技术奖励大会在人民大会堂隆重举行。党和国家领导人习近平、李克强、张高丽、王沪宁等出席大会并为获奖代表颁奖。
至顶网
业界供稿 2018-01-11 07:49:02
UiPath自动化平台助力广汽本田实现业务增长,引领产业数智化!
当下,在新一轮科技革命和产业变革的背景下,UiPath自动化平台已成为广汽本田数字化和智能化转型的抓手之一。
至顶网
业界供稿 2023-02-07 11:39:38
AdaptThink:教会推理模型如何灵活选择思考方式
这项由清华大学张嘉杰等人开发的AdaptThink算法,教会了AI推理模型根据问题难度自动选择思考模式。研究发现,对于简单问题,直接给出答案(NoThinking模式)不仅效率高,
准确率
还可能更好;而复杂问题则需要深入思考(Thinking模式)。通过强化学习技术,AdaptThink实现了智能切换:在三个数学数据集上,模型响应长度减少53%的同时
准确率
还提高了2.4%。这项研究为AI推理模型开辟了新思路,使它们更接近人类灵活思考的能力。
至顶网
科技行者 2025-05-22 13:58:28
快思与慢想:让AI学会像人一样思考的突破性研究——DualityRL团队的"思想家"模型
这项研究提出了"思想家"(Thinker)任务,一种受人类双重加工理论启发的新型AI训练方法。研究者将问答过程分解为四个阶段:快速思考(严格预算下给出初步答案)、验证(评估初步答案)、慢速思考(深入分析修正错误)和总结(提炼关键步骤)。实验表明,该方法使Qwen2.5-1.5B模型的
准确率
从24.9%提升至27.9%,DeepSeek-R1-Qwen-1.5B模型从45.9%提升至49.8%。显著的是,仅使用快速思考模式就能达到26.8%的
准确率
,且消耗更少计算资源,证明了直觉与深度推理作为互补系统的培养价值。
至顶网
科技行者 2025-06-01 16:35:25
<
上一页
1
2
3
4
5
6
7
8
9
10
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号