用了 0.283202秒,为您找到准确率 最高 计划 软件 罔芷 88pkee 驻测相关内容25579 条
  • TAGS:医学问答中兼顾广度与精度的专家-泛医双智能体框架

    TAGS是一种创新的医学问答框架,结合了泛医和专医两种视角,通过层次化检索和不确定性验证机制提升医学AI回答的准确性。该框架由穆罕默德·本·扎耶德人工智能大学等机构的研究团队开发,无需任何模型微调即可显著提升包括GPT-4o和DeepSeek-R1在内的大型语言模型在九个医学问答基准测试上的表现。TAGS通过模拟医疗专家协作、结构化知识检索和质量控制,解决了现有方法在复杂医学推理中的短板,为构建更可靠的医学AI系统提供了新思路。
    至顶网  科技行者  2025-05-30 11:00:04  
  • 华为云双12大幕拉开,9大产品、6大解决方案一站式服务企业上云

    2022年“华为云双12营销季”已重磅开启,华为云以优质的产品解决方案及服务全方位满足企业上云、用云需求,助力企业实现创新增效。即刻登录华为云官网,畅享华为云双12优惠,跟紧这一波年底上云潮吧!
    至顶网  业界供稿  2022-12-09 19:17:34  
  • 加速工业制造智能升级,华为昇腾智能制造使能平台亮相世界5G大会

    11月26日,作为2020年世界5G大会的重要组成部分,由广东省科学技术厅、人工智能与数字经济广东省实验室(广州)、华为技术有限公司、科大讯飞股份有限公司联合主办的第三届中国(广东)人工智能高峰论坛在广州成功举行。
    至顶网  业界供稿  2020-11-27 10:36:42  
  • AI再出力,可通过胸部X光片检测新冠

    该系统对2214张测试图像进行了分类,准确率为83%。
    至顶网  科技行者  2020-12-02 11:02:43  
  • IBM 股价因强劲利润和乐观的 2025 年预期飙升

    IBM第四季度业绩亮眼,利润超预期,2025年展望乐观。收入增长2%至175.6亿美元,每股收益3.92美元超分析师预期。Red Hat和AI业务表现出色,软件业务增长强劲。公司预计2024年收入增长超5%,自由现金流增至130亿美元。市场对IBM战略转型和盈利能力改善反应积极,盘后股价大涨近9%。
    至顶网  SiliconANGLE  2025-01-31 17:27:56  
  • VideoReasonBench:Moonshot AI与北京大学联手推出衡量大型多模态语言模型视频推理能力的新基准测试

    这项研究由Moonshot AI与北京大学合作开展,提出了名为VideoReasonBench的新型基准测试,专门评估多模态大语言模型在视觉为中心的复杂视频推理任务中的表现能力。研究团队发现,包括GPT-4o在内的大多数当前顶尖模型在此类任务中表现不佳(准确率低于10%),唯有思维增强型的Gemini-2.5-Pro模型显著优于其他模型(达到56%准确率)。研究结果表明,拓展思维链推理对现有视频基准测试几乎无益,但对VideoReasonBench至关重要,突显了该测试在评估视频推理能力方面的独特价值。
    至顶网  科技行者  2025-06-03 17:01:37  
  • Snowflake 携手 Anthropic 扩展 AI 工具能力 — 对企业意味着什么

    Snowflake 与 Anthropic 宣布合作,将 AI 代理直接嵌入企业数据环境中。这一合作旨在帮助企业在严格的安全控制下分析海量信息,通过整合 Claude 3.5 Sonnet 模型到 Snowflake 的 Cortex Agents 平台,实现对结构化和非结构化数据的智能分析,为企业 AI 应用提供安全可靠的解决方案。
    至顶网  VentureBeat  2025-02-19 14:18:42  
  • 戴尔 Precision 3660 塔式工作站

    2022年度工作站奖
    至顶网  至顶网站点首页频道  2022-12-26 12:55:23  
  • 瞻博网络Mist以最高的“愿景全面性”荣膺Gartner室内定位服务魔力象限(全球)远见者

    瞻博网络旗下子公司、人工智能网络开拓者及安全人工智能网络领域领导者Mist Systems宣布今年连续第二年荣膺Gartner室内定位服务魔力象限(全球)远见者。
    至顶网  至顶网网络与安全频道  2021-01-19 15:28:25  
  • VS-BENCH: 一项评估视觉语言模型在多智能体环境中战略推理和决策能力的全新基准测试

    VS-BENCH是清华大学和中国科技大学研究团队开发的首个多模态基准测试,专门评估视觉语言模型在多智能体环境中的战略推理和决策能力。研究涵盖八个视觉基础环境,包括合作型、竞争型和混合动机游戏,从战略推理和决策两个维度进行评估。实验结果显示,即使是最先进的视觉语言模型也存在明显不足,最佳模型在推理准确率上仅达47.8%,标准化回报率仅为24.3%。研究还发现模型在提取视觉信息、多智能体协作和战略均衡等方面存在明显短板,为未来研究指明了方向。
    至顶网  科技行者  2025-06-06 17:29:36  
  • 广发证券与华为云基于盘古大模型开展联合创新

    数字化技术是证券行业发展提质增速的核心动能,科技创新能力成为证券行业数字化转型的成功密码。
    至顶网  至顶网大数据频道  2023-06-28 11:20:29  
  • NVIDIA DRIVE Thor

    2022年度智能驾驶创新解决方案奖
    至顶网  至顶网站点首页频道  2022-12-27 14:43:16  
  • CSVQA:中国团队打造超全面科学测评基准,挑战视觉语言模型的STEM推理能力

    这篇研究介绍了CSVQA,一个专为评估视觉语言模型在STEM领域推理能力的中文多模态基准测试。该数据集包含1,378道涵盖物理、化学、生物和数学的问题,每题都要求模型分析科学图表并进行专业推理。实验评估了15种VLM,结果显示即使最强大的模型o1也仅达到49.6%的准确率,揭示了当前AI在科学推理方面的明显局限。研究还发现模型在不同学科表现不一,思维链提示效果因模型而异,为未来改进指明了方向。
    至顶网  科技行者  2025-06-07 08:28:47  
  • 百度推出首个全感官交互输入法,将AI能力全方位落地

    1月16日,在百度输入法“AI·新输入 全感官输入2.0”发布会上,国内首款真正意义上的AI输入法——百度输入法AI探索版正式亮相,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。
    至顶网  业界供稿  2019-01-16 18:30:20  
  • ScanBot:为什么康涅狄格大学研究团队认为机器人不仅需要抓取物体,还应精确扫描物体表面

    ScanBot是康涅狄格大学研究团队开发的首个专为高精度表面扫描设计的指令条件数据集,旨在解决机器人在精细工具使用方面的能力缺口。与传统数据集专注于抓取和导航不同,ScanBot关注亚毫米级精度控制,包含12个物体、6类任务和近900个扫描轨迹。研究评估了GPT-4、Gemini等大模型在参数选择、区域定位和轨迹生成方面的能力,发现即使最先进模型也难以满足工业扫描所需的精度要求,揭示了机器人智能向工具特定感知与控制发展的新方向。
    至顶网  科技行者  2025-05-29 12:04:11  
  • 微软推出新的Azure大学生计划 旨在吸引更多用户加入

    微软日前推出针对大学生的新计划,旨在吸引更多用户加入Azure。微软上周推出新的Azure学生计划,作为现有Azure学生入门计划的补充。Azure学生入门计划原名Azure Imagine订阅。
    至顶网  至顶网软件频道  2018-03-07 15:27:42  
  • NVIDIA创始人兼首席执行官黄仁勋荣获半导体行业最高荣誉

    美国半导体行业协会(SIA)宣布,2021年半导体行业的最高荣誉 —— 罗伯特诺伊斯奖(Robert N. Noyce Award)将授予NVIDIA创始人兼首席执行官黄仁勋。
    至顶网  业界供稿  2021-08-13 12:58:25  
  • 构建高效安全计划需要战略、耐心和清晰愿景

    CISO面临勒索软件、商业邮件诈骗、身份攻击等多种威胁。构建安全计划需把安全方案视为产品,通过平衡先进技术、内部协作与风险管理,确保企业业务畅通无阻。
    至顶网  InformationWeek  2025-05-19 11:12:06  
  • 简洁推理,大有作为:香港科技大学团队通过难度感知提示法精简长推理链

    这篇研究介绍了香港科技大学团队开发的难度感知提示法(DAP),一种能够根据问题难度智能调整推理链长度的创新方法。通过这一方法,研究者构建了LiteCoT数据集,包含10万个简洁推理样本,平均仅720个标记,比传统方法减少约90%。基于此数据集训练的Liter模型系列在多项基准测试中表现优异,在AIME24数学考试上达到74.2%的通过率,同时仅使用约5,000个推理标记。研究证明,精简且难度适应的推理链不仅能节省计算资源,还能提高模型性能,为构建更高效的AI推理系统提供了新思路。
    至顶网  科技行者  2025-06-04 09:16:36  
  • 华为鸿蒙内核100%自主研发,获自主成熟度A级认证

    2024年6月21~23日华为开发者大会HDC 2024在中国松山湖召开,记者在大会期间获悉,中国信息通信研究院为华为鸿蒙内核颁发了信息产品自主成熟度认证证书,其自主研发比率为100%,自主成熟度等级为A级。
    至顶网  业界供稿  2024-06-27 17:51:09  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号