用了 0.036540秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容2310 条
  • ALPHAONE:让大型推理模型在测试时灵活转换快慢思考模式的通用框架

    ALPHAONE(α1)是伊利诺伊大学香槟分校和加州大学伯克利分校共同研发的通用框架,能在测试时灵活调节大型推理模型的思考速度。这一框架引入"α时刻"概念,在此之前通过随机过程动态安排慢思考转换,之后则确定性地终止慢思考并促进快速推理。与现有方法相比,α1在数学、编码和科学推理基准测试上取得显著提升,平均准确率提高4.65%-6.15%,同时保持更高效率。研究发现模型先慢后快的思考模式效果最佳,这与人类常见的思考模式不同,为AI推理设计提供了新见解。
    至顶网  科技行者  2025-06-04 16:06:47  
  • 这个AI"学霸"掌握了万物规律:清华团队让大语言模型变身超级数据分析师

    中科院大学等机构联合开发的MachineLearningLM突破了大语言模型在数据分析方面的局限。该系统通过300万个合成任务的训练,能够在看到数百个例子后自动掌握各种数据预测规律。测试显示,它在金融、医疗等领域的分析准确率显著超越传统模型,同时保持了优秀的语言理解能力,为实现真正的通用人工智能分析系统开辟了新路径。
    至顶网  科技行者  2025-09-25 14:41:06  
  • 德州仪器 (TI) 推出新一代支持边缘 AI 的雷达传感器和汽车音频处理器,帮助汽车制造商重新定义和改进车内的驾乘体验

    德州仪器 (TI)推出了全新的集成式汽车芯片,能够帮助各个价位车辆的驾乘人员,实现更安全、更具沉浸感的驾驶体验。
    至顶网  至顶网计算频道  2025-01-08 20:45:24  
  • 浙大团队破解AI大模型"教学相长"难题:让机器老师和学生同时进步

    浙江大学团队开发的Cooper框架实现了AI训练中的"教学相长",通过同步优化策略模型和奖励模型,成功解决了传统训练中的奖励黑客攻击问题。该框架让AI老师和学生同步成长,在数学推理任务上实现了显著性能提升,为构建更稳定可靠的AI系统开辟了新路径。
    至顶网  科技行者  2025-08-18 10:17:59  
  • 施耐德电气发布新一代Prisma E 标准化低压成套分配电设备

    近日,2022施耐德电气全新Prisma E 标准化低压成套分配电设备发布会于上海顺利举办。
    至顶网  业界供稿  2022-11-25 11:48:30  
  • AI的医学影像诊断率超过人类医生

    基于深度神经网络的AI系统正在以惊人的效率分析医学影像,并诊断其中的潜在病症。
    至顶网  科技行者  2019-10-09 15:52:47  
  • 多空间理解新突破:Meta研究团队打造多帧空间理解的多模态大语言模型

    这篇研究介绍了Meta团队开发的Multi-SpatialMLLM,一种能够理解多帧图像空间关系的多模态大语言模型。研究者创建了首个大规模多帧空间理解数据集MultiSPA,包含超过2700万个样本,并在此基础上训练模型掌握深度感知、视觉对应和动态感知能力。实验表明,该模型显著超越了现有系统,在空间理解任务上平均提升36%,并展示出多任务协同效应和能力涌现现象,为机器人学习等实际应用提供了新的可能性。
    至顶网  科技行者  2025-05-28 18:36:30  
  • 小模型也能超越大模型?KRAFTON揭秘让AI学会"自己验证答案"的神奇工具

    KRAFTON研究团队提出T1方法,让小型AI模型通过借助代码解释器等外部工具进行自我验证,解决了小模型记忆力有限导致的验证准确性问题。实验显示,10亿参数的模型配合T1方法在数学推理任务上能够超越80亿参数的独立模型,为小型AI模型的高效部署开辟了新路径。
    至顶网  科技行者  2025-07-14 14:39:07  
  • 多语思考能力:探索多语言环境如何提升大语言模型的推理能力

    想象一下,你正在学习一门复杂的数学问题。有时候,用你的母语思考可能会让你卡壳,但当你尝试用另一种语言重新思考这个问题时,突然间思路就变得清晰了。这种现象不仅存在于人类认知中,研究团队发现,大语言模型也展现出类似的特性。
    至顶网  科技行者  2025-04-21 15:05:18  
  • 对抗伪装:当AI内容学会化身成人类,检测器将如何应对?

    这项研究揭示了机器生成文本检测器的重大漏洞。意大利研究团队通过直接偏好优化技术,成功训练AI模型生成更像人类的文本,导致顶尖检测器准确率下降高达60%。研究者分析了语言特征分布变化,发现经过训练的模型能有效模仿人类写作特征,而检测器主要依赖于浅层语言线索识别AI文本。这一发现为开发更可靠的检测方法提供了重要参考,同时也警示我们区分人类与AI内容将变得越来越困难。
    至顶网  科技行者  2025-06-06 11:22:22  
  • GeoRanker:基于距离感知排序的全球图像地理定位新方法——威斯康星大学与香港城市大学联合研究突破

    这篇研究论文介绍了"GeoRanker",这是一种突破性的全球图像地理定位方法,由香港城市大学和威斯康星大学麦迪逊分校研究人员联合开发。不同于传统方法,GeoRanker采用了距离感知排序框架,利用大型视觉语言模型对查询图像与候选位置之间的关系进行建模。核心创新在于提出的多阶距离损失,不仅考虑绝对距离还建模相对空间关系,以及构建的首个地理排序数据集GeoRanking。实验表明,GeoRanker在IM2GPS3K和YFCC4K基准测试上显著超越现有方法,在街道级准确率上分别提升12.9%和37.3%。
    至顶网  科技行者  2025-05-27 10:26:01  
  • 简洁推理,大有作为:香港科技大学团队通过难度感知提示法精简长推理链

    这篇研究介绍了香港科技大学团队开发的难度感知提示法(DAP),一种能够根据问题难度智能调整推理链长度的创新方法。通过这一方法,研究者构建了LiteCoT数据集,包含10万个简洁推理样本,平均仅720个标记,比传统方法减少约90%。基于此数据集训练的Liter模型系列在多项基准测试中表现优异,在AIME24数学考试上达到74.2%的通过率,同时仅使用约5,000个推理标记。研究证明,精简且难度适应的推理链不仅能节省计算资源,还能提高模型性能,为构建更高效的AI推理系统提供了新思路。
    至顶网  科技行者  2025-06-04 09:16:36  
  • 拆解断点思维链:大模型推理效率革命 - 阿姆斯特丹大学与Salesforce AI联合研究

    这项研究提出了一种名为"断点思维链推理"的创新方法,颠覆了大语言模型中"完整思考过程必不可少"的传统观念。研究表明,在思考链中途截断并直接生成答案竟能达到甚至超过完整推理的准确率,同时显著节省计算资源。基于此,研究者开发了"断点采样"框架,在思考轨迹数量、每轨迹解答数量和思考截断深度三个维度上灵活分配资源。在多个复杂推理基准测试中,断点采样实现了更优的准确率与计算成本平衡,为资源受限环境下的AI部署提供了实用解决方案。
    至顶网  科技行者  2025-05-22 08:22:41  
  • Glotech解决方案

    高重科技未来将搭建渗透目标行业的服务体系,持续开发自有品牌,提升利润空间,多维度创造价值。
    至顶网  业界供稿  2018-11-24 15:09:05  
  • 阿里巴巴团队破解AI视觉理解难题:让机器像人一样"看懂"几何图形

    阿里巴巴达摩院联合南洋理工大学的研究团队发现,当前AI模型在几何推理中频繁出错的根本原因是视觉感知能力不足。他们提出了分阶段训练框架,先强化AI的基础视觉感知能力,再进行复杂推理训练。实验显示,这种方法使3B参数模型在几何推理任务上准确率提升9.7%,接近GPT-4o的表现水平,为AI视觉理解能力提升提供了新思路。
    至顶网  科技行者  2025-09-28 09:51:33  
  • 量子计算遇上传统算法:康考迪亚大学团队揭示混合模型的神奇表现

    康考迪亚大学研究团队通过对比混合量子-经典神经网络与传统模型在三个基准数据集上的表现,发现量子增强模型在准确率、训练速度和资源效率方面均显著优于传统方法。研究显示混合模型的优势随数据集复杂度提升而增强,在CIFAR100上准确率提升9.44%,训练速度提升5-12倍,且参数更少。该成果为实用化量子增强人工智能铺平道路。
    至顶网  科技行者  2025-09-29 14:31:10  
  • 大模型如何"思考"?杜克大学研究揭秘回溯思考对LLM推理能力的影响

    这篇研究探索了大型语言模型(LLM)中回溯思考对推理能力的影响,以及监督微调(SFT)与强化学习(RL)的相互作用。杜克大学的研究团队发现,任务难度与最优回溯次数成正比:简单任务(如Arc 1D)适合零回溯,中等难度任务(如Countdown)需要一次回溯,而复杂任务(如Sudoku)则需要五次回溯。研究还揭示,训练数据的结构比内容正确性更重要,且简短思考链也能为RL提供有效起点。这些发现为优化AI推理能力提供了实用指导。
    至顶网  科技行者  2025-06-06 17:30:17  
  • 突破思维瓶颈:UC Berkeley团队研发的自适应并行思考新方法让AI更高效解决复杂问题

    想象一下,你面对一个复杂的数学问题。作为人类,我们通常会怎么做?有时我们会一步步推导,但当问题变得复杂时,我们可能会同时探索几个不同的解题思路,最后选择最有效的那条路径。更重要的是,我们可以灵活地决定什么时候应该专注于单一路径,什么时候应该尝试多种可能性。
    至顶网  科技行者  2025-04-24 14:18:24  
  • FlowReasoner:强化型查询级元智能体的突破性研究

    想象一下,你正在使用一个餐厅点餐系统。传统的系统可能只有一套固定的点餐流程,无论你是来喝咖啡、吃简餐还是举办宴会,都要经过同样的步骤。这就像当前的任务级多智能体系统——它们为特定类型的任务(比如代码生成)设计一套固定的工作流程,所有查询都必须按照这一流程处理。
    至顶网  科技行者  2025-04-23 17:44:26  
  • 统一理解与生成的"大脑分工":上海AI实验室揭示多模态AI的两难困境与解决方案

    上海AI实验室研究团队发现统一多模态AI中图像理解与生成任务存在根本冲突:理解需要逐层增强语义关联,生成则需要早期语义指导后期专注细节。他们提出UniFork架构,采用"共享浅层+分离深层"的Y型设计,有效解决任务冲突问题,在保持统一性同时达到专门模型性能水平。
    至顶网  科技行者  2025-06-25 14:53:35  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号