搜一下
用了 0.340967秒,为您找到
准确率
最高
计划
软件
罔芷
88pkee
驻测
相关内容26955 条
Ampere Computing发布全新AmpereOne系列处理器,192个自研核
Ampere Computing宣布推出全新 AmpereOne系列处理器,该处理器拥有多达192个单线程Ampere核,内核数量为业界
最高
。
至顶网
Ampere 2023-05-19 15:45:00
揭开真相:现有长视频理解评估其实靠猜?多伦多大学团队推出更公平的VideoEval-Pro评测基准
这项研究揭示了现有长视频理解评估基准的严重缺陷:过度依赖多选题导致结果膨胀,且许多问题存在先验偏好使模型无需真正理解视频就能作答。针对这些问题,多伦多大学团队开发了VIDEOEVAL-PRO基准,采用开放式短答案形式,真正要求理解整个视频。通过评估21个专有和开源模型,研究发现:视频模型在开放式问题上的表现比多选题下降超过25%,且多选题高分并不意味着开放式题高分。与其他基准不同,VIDEOEVAL-PRO随输入帧数增加持续提升性能,提供了更可靠的长视频理解能力评估方法。
至顶网
科技行者 2025-05-26 08:16:36
多语思考能力:探索多语言环境如何提升大语言模型的推理能力
想象一下,你正在学习一门复杂的数学问题。有时候,用你的母语思考可能会让你卡壳,但当你尝试用另一种语言重新思考这个问题时,突然间思路就变得清晰了。这种现象不仅存在于人类认知中,研究团队发现,大语言模型也展现出类似的特性。
至顶网
科技行者 2025-04-21 15:05:18
极狐(GitLab) 荣获「国家高新技术企业」认证
极狐(GitLab) 自成立以来,始终以 “核心开放” 为原则,面向中国市场,提供开箱即用的开放式一体化安全 DevOps 平台——极狐GitLab。
至顶网
业界供稿 2023-04-13 15:33:44
戴尔与爱立信合作,聚焦集成云原生解决方案
戴尔与爱立信宣布建立战略合作伙伴关系,旨在将双方在电信
软件
、解决方案和支持方面的专业知识相结合,帮助电信运营商实现无线接入网络(RAN)云转型。
至顶网
至顶网网络与安全频道 2024-06-18 10:17:18
PHYX:大模型的物理推理能力测试,揭示AI在视觉物理问题上的惊人差距
香港大学等机构研究者开发的PHYX基准测试评估了AI模型的物理推理能力,结果显示即使最先进的GPT-4o等多模态模型在此类任务上的
准确率
仅为32.5%-45.8%,比人类专家低29%以上。PHYX包含3000个跨六大物理领域的多模态问题,要求模型整合领域知识、符号推理和现实约束理解。分析发现模型存在视觉推理错误、过度依赖文本描述和数学公式等关键缺陷,为未来开发物理感知AI系统提供了重要指导。
至顶网
科技行者 2025-05-29 10:26:09
数据梳理:AI正在全球75个国家地区“看”着你
最近,一些机构关于人工智能领域的进展、调查、研究和预测,反映了AI的一些问题——比如AI监控在全球范围内的逐渐壮大,企业数据隐私声明忽略了“遵守通用隐私原则”,全球企业对AI的采用日益广泛,以及机构投资者把AI视为一大风险的趋势。
至顶网
科技行者 2019-09-23 12:59:45
谷歌研究:大语言模型在压力下会放弃正确答案
谷歌DeepMind和伦敦大学学院研究发现,大语言模型在面对反驳时会迅速失去信心并改变答案,即使反驳是错误的。研究显示LLM既会对自己的答案过度自信,又对批评异常敏感,表现出与人类相似但又独特的认知偏差。这种行为对多轮对话AI系统构成威胁,最新信息可能对LLM推理产生不成比例的影响。
至顶网
VentureBeat 2025-07-16 22:57:15
MBZUAI团队突破性技术:让x86程序瞬间"变身"ARM,性能还比苹果原生方案更快
MBZUAI研究团队开发的GG技术突破了跨架构程序翻译难题,通过AI将x86程序准确翻译为ARM版本,
准确率
达99.39%。与苹果Rosetta 2相比,性能快73%、省电47%、内存占用少141%。该技术采用大型语言模型结合严格测试验证,为硬件架构迁移提供了高效解决方案,将推动ARM处理器在数据中心的快速普及。
至顶网
科技行者 2025-06-24 10:14:04
AI推理新突破:Zoom团队发现的"写少想快"秘密让ChatGPT效率飙升80%
Zoom研究团队发现了让AI"写少想快"的新方法——思维草稿法,通过模仿人类简洁思考方式,让AI只记录关键信息而非详细解释。实验显示这种方法在保持90%以上
准确率
的同时,只需使用传统方法7.6%的文字量,大幅提升处理速度并降低成本,为AI应用的普及和可持续发展开辟了新路径。
至顶网
科技行者 2025-07-31 11:27:40
对抗伪装:当AI内容学会化身成人类,检测器将如何应对?
这项研究揭示了机器生成文本检测器的重大漏洞。意大利研究团队通过直接偏好优化技术,成功训练AI模型生成更像人类的文本,导致顶尖检测器
准确率
下降高达60%。研究者分析了语言特征分布变化,发现经过训练的模型能有效模仿人类写作特征,而检测器主要依赖于浅层语言线索识别AI文本。这一发现为开发更可靠的检测方法提供了重要参考,同时也警示我们区分人类与AI内容将变得越来越困难。
至顶网
科技行者 2025-06-06 11:22:22
新思科技分析如何应对六大常见的
软件
应用安全挑战
安全已被视为应用程序
软件
开发中最具挑战性的一部分。无论是研发团队还是管理团队都应该仔细研究最常见的应用程序安全挑战,在网络不法分子发起攻击前就提前做好防护,避免敏感数据被盗。
至顶网
业界供稿 2020-07-15 15:28:55
航空公司迫切需要推动航空管理的数字化转型
随着夏季的到来,很多朋友可能早已按捺不住激动的情绪。而在我看来,这也是航空业自我审视并评估数字化转型机遇的最佳时机……这既是为了航空公司自身,也是为了改善我们乘客的出行体验。
至顶网
Forbes 2019-06-19 22:08:11
Imagination的GPU和AI加速器应用于AIoT最新的RISC-V应用
Imagination Technologies宣布,已授权阿里巴巴集团旗下平头哥半导体在其最新RISC-V应用处理器中使用IMG B系列GPU和PowerVR Series3NX NNA核。这些应用处理器将被用于人工智能物联网(AIoT)的应用。
至顶网
业界供稿 2022-08-25 13:21:41
思科宣布收购Socio Labs 打造Webex全方位虚拟会议平台
思科昨天宣布
计划
收购Socio Labs,其是一家得到风投支持的、提供用于组织虚拟会议和管理门票销售等相关任务的
软件
公司。预计此次收购将在7月25日之前完成。思科
计划
利用Socio Labs的
软件
来增强自身Webex视频会议服务的功能,以举办在线活动。
至顶网
siliconANGLE 2021-05-13 12:25:35
老用户尊享六大权益,华为云双十二重磅福利大回馈
此次活动,针对老用户华为云推出的活动专区中,包括了专属上云礼包、专享钜惠、登录抽奖、购产品享返券、豪礼加额增、免费试用六重福利,以前所未有的重磅力度,开启老用户回馈专场。
至顶网
业界供稿 2021-12-17 18:02:23
牛津医学研究揭示聊天机器人测试中的关键缺失环节
牛津大学研究发现,尽管大语言模型在医学考试中表现出色,但在实际应用中效果大打折扣。研究显示,LLM直接测试时能94.9%准确识别病症,但人类使用LLM诊断时
准确率
仅34.5%,甚至低于不使用AI的对照组。问题源于用户提供信息不完整、LLM理解偏差等人机交互问题。专家指出,仅凭非交互式基准测试评估LLM存在误导性,需要真实的人机交互测试才能准确评估AI系统的实际性能。
至顶网
VentureBeat 2025-06-16 10:26:22
思杰南京研发中心作为高端研发机构荣获南京市2018年度科技发展政府扶持资金
近日,思杰南京研发中心作为高端研发机构荣获南京市2018年度科技发展政府扶持资金。该奖项由南京市政府授予,旨在贯彻落实南京市委市政府创新驱动“121”战略,全面推进创新名城建设。
至顶网
业界供稿 2019-01-17 16:57:27
紧跟变化、快速响应 Parallels Desktop 17 for Mac更新看点多
Parallels高级产品经理Kurt Schmucker告诉记者,Parallels Desktop最主要的功能是能让Mac用户在他们的计算机上无需重启就能运行Windows应用程序。我们可以把Parallels Desktop理解为是存在于Windows系统和macOS之间的桥梁。
至顶网
李祥敬 2021-08-17 10:47:21
AI的医学影像诊断率超过人类医生
基于深度神经网络的AI系统正在以惊人的效率分析医学影像,并诊断其中的潜在病症。
至顶网
科技行者 2019-10-09 15:52:47
<
上一页
33
34
35
36
37
38
39
40
41
42
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号