搜一下
用了 0.034956秒,为您找到
准确率
最高
计划
软件
罔芷
88pkee
驻测
相关内容2181 条
AI被最新"空间推理"题目难倒了!EPFL和ETH科学家打造地狱级多模态测试,所有顶级模型全军覆没
瑞士EPFL和ETH研究团队发布MARBLE基准测试,专门评估AI的复杂空间推理能力。测试包含Portal游戏启发的M-Portal和3D拼图M-Cube两大任务,要求AI进行多步骤规划和3D空间组装。结果显示包括GPT-4o在内的12个顶级多模态AI模型几乎全部失败,在最难任务上
准确率
接近0%,暴露了当前AI在真正智能推理方面的重大缺陷。
至顶网
科技行者 2025-07-03 10:00:33
爱护乳腺,AI不宜迟 ----英特尔人工智能助力乳腺癌早筛及诊治
大数据、云计算、人脸识别、自动驾驶……近年来这些耳熟能详的人工智能科技,正在悄然改变着我们的生活。英特尔作为全球领先的科技公司,一直致力于人工智能技术的发展。
至顶网
业界供稿 2018-10-08 16:59:35
重新思考大型语言模型推理的采样标准:基于能力-难度对齐的视角
本研究提出了"能力-难度对齐采样"方法(CDAS),革新了大型语言模型强化学习训练中的数据采样策略。与传统方法不同,CDAS通过聚合历史表现差异实现更稳定的问题难度估计,并将模型能力与问题难度动态匹配。在多个数学推理基准测试中,CDAS达到了46.77%的
最高
平均
准确率
,同时比竞争策略提高了2.33倍的计算效率。研究还证明了CDAS在代码生成任务和更大型模型上的有效性,为提升大型语言模型的推理能力提供了高效可靠的新方法。
至顶网
科技行者 2025-05-29 14:50:15
新型AI架构推理速度比大语言模型快100倍,仅需1000个训练样本
新加坡AI初创公司Sapient Intelligence开发出层次推理模型(HRM),在复杂推理任务上匹配甚至超越大语言模型性能,同时显著降低数据和内存需求。该架构模仿人脑双系统运作机制,通过高层抽象规划模块和低层快速计算模块协同工作,避免了链式思维推理的局限性。在极难数独和迷宫问题上,HRM仅用1000个训练样本就达到近完美
准确率
,而先进语言模型完全失败。
至顶网
VentureBeat 2025-07-28 09:16:49
数智化履约提质增效 多点DMALL SaaS系统再获行业嘉奖
9月27日,中国物流与采购联合会主办的“2022中国同城即时物流行业峰会”在宁波举行。多点DMALL SaaS研发中心高级总监陈品竹受邀分享主题演讲《数智化履约助力实体零售提质增效》。
至顶网
业界供稿 2022-09-29 11:36:56
英特尔携手德尚韵兴,为医疗创新注入智能动力
德尚韵兴医疗科技有限公司(德尚韵兴)正在应用英特尔(R)
软件
保护拓展(英特尔(R)SGX)和英特尔(R)oneAPI数学核心函数库(oneMKL),在边缘的医疗设备上保护其医疗人工智能算法和知识产权。
至顶网
业界供稿 2021-02-24 11:55:09
香港中大团队让AI看懂网页设计图,直接生成完整前端代码
香港中大团队开发出ScreenCoder系统,能够直接将网页设计图转换为完整的HTML/CSS代码。该系统采用三个专门AI助手协作的方式:识别专家负责检测界面元素,规划专家构建布局结构,代码生成专家输出最终代码。测试显示布局
准确率
达75.5%,显著超越现有方法。该技术不仅提高了网页开发效率,还能作为训练数据工厂改进其他AI模型,为设计到代码的自动化转换提供了新的解决方案。
至顶网
科技行者 2025-08-06 11:08:11
英特尔携手阿普奇发布全新工业产品,引领制造业智能化转型升级
英特尔与苏州阿普奇物联网科技有限公司联合举办2024阿普奇生态大会暨新品发布会。
至顶网
业界供稿 2024-04-12 12:10:31
OpenAI 新推出的语音 AI 模型 gpt-4o-transcribe 让你几秒钟内为现有文本应用添加语音功能
OpenAI 发布三款全新专有语音模型,包括 gpt-4o-transcribe、gpt-4o-mini-transcribe 和 gpt-4o-mini-tts。这些模型基于 GPT-4o 开发,提供更准确的转录和语音合成能力,支持 100 多种语言,可通过 API 集成到第三方应用中。新模型在英语转录
准确率
方面表现出色,错误率仅为 2.46%,并支持语音定制和情感表达。
至顶网
VentureBeat 2025-03-21 17:19:38
大语言模型在"混合语言"面前的尴尬:MBZUAI揭示AI理解多语言混用文本的真实水平
MBZUAI和巴黎综合理工学院研究团队系统评估了大语言模型对混合语言文本的理解能力,发现当英语中混入其他语言时模型性能下降,但其他语言中混入英语时性能反而提升,揭示了AI系统的语言偏见问题,并提出了通过专门训练改善的有效方案。
至顶网
科技行者 2025-06-27 11:43:59
广发证券与华为云基于盘古大模型开展联合创新
数字化技术是证券行业发展提质增速的核心动能,科技创新能力成为证券行业数字化转型的成功密码。
至顶网
至顶网大数据频道 2023-06-28 11:20:29
腾讯安全与青藤云安全联合发布“天眼云镜”主机安全产品
11月28日,腾讯安全与青藤云安全在北京召开发布会,宣布在云安全领域展开战略合作。以腾讯云提供的高效稳定、安全可控的云服务为基础,加码云安全建设,为行业客户提供“天眼云镜”企业私有数据中心主机安全解决方案。
至顶网
业界供稿 2018-11-28 22:43:03
微软团队新突破:让AI推理"短小精悍"而非冗长啰嗦,效果竟然更好?
微软研究团队发现AI推理模型存在"长度膨胀"问题——回答冗长啰嗦但准确性并未提升。他们提出GFPO方法,通过训练时生成更多候选答案但只学习最简洁有效的回答,成功将AI回答长度减少46%-85%,同时保持原有准确性。该方法在数学竞赛、科学问答等多个基准测试中表现优异,为AI推理效率优化提供了新思路。
至顶网
科技行者 2025-08-18 13:59:48
语音助手排名:谷歌最聪明、Alexa迎头赶上、Cortana有惊喜、Siri掉队
Google Assistant是最聪明的智能助理;微软Cortana非常出色,排在第二位;亚马逊Alexa的学习速度比其他任何助理都要快。但是苹果的Siri呢?它仍在挣扎中。
至顶网
Forbes 2018-04-26 18:38:13
Adjust推出由AI和高级机器学习赋能的移动数据分析解决方案InSight
借助Adjust InSight强大的功能和洞见,营销人员能够以隐私保护为前提,基于丰富数据做出明智营销决策,进而推动ROI增长
至顶网
业界供稿 2024-04-18 10:49:12
聚焦工业边缘需求,英特尔与阿普奇携手发布创新解决方案
英特尔与苏州阿普奇物联网科技有限公司联合举办2024阿普奇生态大会暨新品发布会。
至顶网
业界供稿 2024-04-11 15:19:05
阿里新赛事启动:如何更快解析蛋白质的结构?
近日,阿里云携手英特尔(中国)主办的“英特尔创新大师杯”冷冻电镜蛋白质结构建模大赛宣布开放报名。据介绍,该赛事旨在探索人工智能在获取蛋白质结构原子模型方面的潜力。
至顶网
至顶网大数据频道 2021-08-26 11:21:45
重大特性升级,1大工具发布,MindSpore一周年实力“狂欢”
为庆祝开源一周年,MindSpore社区邀请行业大咖、专家学者和社区开发者面向全球进行直播,MindSpore新特性和TinyMS新工具在此次直播中首次亮相。
至顶网
业界供稿 2021-04-01 11:43:47
蜜度携“跨模态信息检索”与“智能校对”两大应用开启数智化新未来
作为蜜度以强大科研能力与深邃行业洞察研发的两大创新应用,跨模态信息检索和智能校对能够成为深化数据价值和提升工作效率的重要途径。
至顶网
业界供稿 2022-09-06 10:26:35
大语言模型中的分词限制:一项探究符号和算术推理边界的研究
这项由不列颠哥伦比亚大学张翔和曹俊泰领衔的研究,揭示了大语言模型中一个被忽视的关键限制:分词系统对符号和算术推理能力的影响。研究团队发现,即使使用思维链提示技术,模型的推理能力仍受制于分词格式。通过将原子符号(如字母)明确分割的输入格式,可使模型在计数、排序和反转等任务上的
准确率
提升高达80%。实验证明,在优化分词条件下,较小模型甚至能超越更大模型的表现。这一发现颠覆了传统认知,提示我们分词设计对模型能力的重要性不亚于模型架构本身。
至顶网
科技行者 2025-05-26 08:06:03
<
上一页
18
19
20
21
22
23
24
25
26
27
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号