搜一下
用了 0.116606秒,为您找到
mg
性价比
最高
高达
網纸
YB233
相关内容10170 条
数学天才都被AI算哭了!斯坦福大学推出史上最难数学考试,连最强AI模型都只能考42分
斯坦福大学研究团队开发了史上最具挑战性的AI数学推理测试系统Putnam-AXIOM,基于威廉·洛威尔·普特南数学竞赛的522道大学级难题。测试结果显示,即使最强的AI模型也只能达到42%的正确率,远低于它们在传统测试中的表现。研究还创新性地引入了变形题目生成和教师强制准确率评估方法,有效识别了AI对训练数据的记忆依赖问题,为真实评估AI数学推理能力提供了新标准。
至顶网
科技行者 2025-08-15 15:06:29
UNC最新突破:AI看视频终于会"思考"了!仅用3.6%训练数据让机器推理能力暴涨
这项研究开发了VIDEO-RTS系统,仅用传统方法3.6%的训练数据就让AI学会了真正的视频推理能力。系统采用"纯强化学习"跳过死记硬背阶段,结合"稀疏到密集"的自适应推理策略,在五个权威测试中平均准确率提升2.4%。这一突破性进展可能改变AI视频理解的发展方向。
至顶网
科技行者 2025-07-18 10:01:06
寻找永葆青春的密码,这家公司终极目标是用AI搞定“长生不老”
Insilico Medicine是一家诞生于数字化时代,或者说计算机时代的企业。这家公司位于巴尔的摩,其专注于利用新一代人工智能与区块链技术进行药物发现、生物标记开发以及衰老研究。
至顶网
科技行者 2018-02-22 12:28:04
北京大学团队突破性进展:让AI从看懂动作变成创造表演者
北京大学团队开发的ReMoMask系统实现了文本到3D人体动作生成的重大突破,通过双向动量学习、语义时空注意力和检索增强指导三项核心创新,在权威数据集上取得显著性能提升,为电影制作、游戏开发、虚拟现实等领域提供了高质量的动作生成解决方案,标志着人工智能向更自然人机交互迈进的重要进展。
至顶网
科技行者 2025-08-07 14:19:08
上海AI实验室推出游戏编程界的"智能教练":V-GameGym如何让AI学会写游戏代码?
上海AI实验室推出V-GameGym测试平台,首次全面评估AI模型的游戏开发能力。该平台包含2219个高质量游戏样本,采用代码、视觉、动态三维评估体系。测试70个AI模型发现,即使最优秀的GPT-5也只能成功开发45%的游戏,AI在编程逻辑方面表现良好但视觉设计能力不足,为AI辅助游戏开发指明了改进方向。
至顶网
科技行者 2025-10-16 17:30:03
LLM聊天机器人学会了察言观色:希伯来大学突破性研究让AI懂得何时说话
这个突破意味着,未来的AI助手将不再是被动的问答机器,而是能够主动、适时地参与人类对话的智能伙伴。
至顶网
至顶AI实验室 2025-06-19 16:21:44
绘就共商共享新画卷,谱写善治善智新篇章——写在2024世界人工智能大会开幕之前
2024年7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议即将在浦江之畔揭开帷幕。在“一带一路”倡议提出十周年的时间节点,在AI Agent再次引爆人工智能新热潮的现在,在各类人工智能技术及应用不断融入人们日常生活的当下,此次大会讲“以共商促共享,以善治促善智”作为主题,聚集世界各国代表、顶级专家学者、行业精英、初创团队等,共同探讨在人工智能深度发展时代下的热点话题。
至顶网
至顶网人工智能频道 2024-07-03 12:51:10
绘就共商共享新画卷,谱写善治善智新篇章——写在2024世界人工智能大会开幕之前
本届大会由外交部、国家发展改革委、教育部、科技部、工业和信息化部、国家网信办、中国科学院、中国科协和上海市政府共同主办,打造“会议论坛、展览展示、评奖赛事、智能体验”四大板块,聚焦人工智能领域前沿技术、产业动向、向善治理等全球人工智能行业普遍关心的领域。
至顶网
科技行者 2024-07-03 12:52:42
痛击马斯克:Meta打造Threads的幕后故事
一家身陷危机的公司返璞归真,并迅速掀起病毒式传播。但如此赤裸裸地复制Twitter,能否为这家老迈的科技巨头注入新的活力?
至顶网
The Washington Post 2023-08-02 11:10:15
HoPE:视觉语言模型中的混合位置编码技术让AI更懂长视频
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
至顶网
科技行者 2025-06-03 07:45:19
2018年中国大数据BI行业分析报告
帆软数据应用研究院调研了规模不一的216家企事业单位,了解到他们的大数据BI应用状态、需求情况、对大数据BI产品功能的期待,同时基于帆软数据应用研究院对行业的长期观察和思考,形成了该篇报告。
至顶网
帆软数据应用研究院 2018-02-26 10:28:33
AI的视觉盲点:伊利诺伊大学团队揭示多模态推理中的"看不见"问题
伊利诺伊大学研究团队发现AI在多模态推理中存在严重的视觉理解缺陷,67%的错误源于对图像信息的误解。他们开发了PAPO方法,通过图像遮挡技术强迫AI真正使用视觉信息,实现了4.4%的性能提升。这项研究对AI在教育、医疗、自动驾驶等领域的可靠应用具有重要意义。
至顶网
科技行者 2025-07-18 09:37:47
伯克利团队揭秘:AI"思考方式"大比拼,哪种最聪明?
伯克利大学研究团队通过测试15个AI模型在五种推理策略上的表现,发现AI的"思考方式"直接影响答题效果。大模型可灵活运用各种策略,小模型需精准匹配任务特点。数学题适合步骤式推理,开放问题需要搜索式方法,效率优先场景宜选简洁策略。研究揭示了AI推理能力的规模门槛效应。
至顶网
科技行者 2025-10-16 15:12:41
Skywork AI的多模态推理新突破:让AI像人类一样"慢慢思考"解决复杂问题
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
至顶网
科技行者 2025-07-15 11:38:26
人工智能专家团队首次让AI"专家"自己选择任务:中美研究团队颠覆混合专家模型传统设计
中美研究团队提出专家自主选择的AI新架构,让AI专家根据内在激活强度自主选择处理任务,避免传统路由器分配的不匹配问题。在40亿参数模型验证中,新方法在多项任务上超越传统混合专家模型,实现更均衡的负载分配和更高的处理效率,为大规模AI系统的专业化分工提供了创新解决方案。
至顶网
科技行者 2025-09-16 11:08:56
停车场正在成为未来的商务中心和科技创新枢纽
停车场运营商APCOA正利用大数据将传统停车场转化为移动枢纽,在提供电动汽车充电之余,还可作为小企业的办公空间和配送公司的仓储地点。
至顶网
至顶网CIO与CTO频道 2023-04-04 16:11:03
复旦大学推出BMMR数据集:让AI跨越知识鸿沟,从数学天才走向通识博士
复旦大学团队发布BMMR数据集,这是首个大规模跨学科多模态推理评估基准,包含11万个涵盖300个学科的大学水平问题。研究发现即使最先进的AI模型在跨学科推理中表现有限,揭示了当前AI发展的重要盲点。该数据集支持中英双语,配备专门的推理过程评估工具,为AI向通用智能发展提供重要支撑。
至顶网
科技行者 2025-07-11 10:15:30
Salesforce突破性成果:让AI自动设计提示词,普通人也能轻松驾驭大语言模型
Salesforce推出的Promptomatix是首个零配置提示词自动优化框架,让普通用户无需技术背景即可生成高质量AI提示词。系统通过智能任务分析、自动数据生成和成本感知优化,在五类NLP任务测试中均表现优异,特别在文本分类上提升15-20%。该技术有望大幅降低AI应用开发门槛,推动人工智能技术普及。
至顶网
科技行者 2025-07-29 09:33:33
中科大团队挑战AI视觉:让AI真正"看懂"世界,不只是回答问题
研究团队开发了IR3D-Bench基准测试,要求AI根据单张图片重建完整3D场景,以此检验AI是否真正理解所见世界。测试涵盖20多个顶尖AI模型,结果显示虽然AI在物体识别上表现出色,但在空间关系理解和尺寸估计方面存在明显不足。研究为评估AI视觉理解能力提供了新标准。
至顶网
科技行者 2025-07-03 16:24:32
大模型的"藏宝图训练法":Cohere实验室让AI学会精准找到少见任务的最佳答案
Cohere实验室提出了"Treasure Hunt"训练方法,通过在训练阶段为大语言模型添加90个详细标记(涵盖质量、长度、语言、任务类型等),创建了一套智能导航系统。该方法特别针对模型在低频"长尾任务"上的表现不佳问题,通过标记丢弃策略让模型学会自主推断。实验显示整体性能提升5.7%,长尾任务提升9.1%,代码修复任务提升14.1%,同时将长度控制违规率从36.58%降至1.25%。
至顶网
科技行者 2025-06-23 11:46:20
<
上一页
481
482
483
484
485
486
487
488
489
490
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号