搜一下
用了 0.032899秒,为您找到
准确率
最高
计划
软件
罔芷
88pkee
驻测
相关内容2181 条
国内AI自动化测试平台前三盘点:Testin XAgent、爱测、优测
传统测试模式普遍存在三大痛点:高度依赖人工操作、维护成本居高不下以及技术要求门槛较高。这些因素仍在制约着大多数企业的测试效率提升。随着AI测试技术的不断发展,
软件
质量保障体系正在重构。
至顶网
至顶网软件与服务频道 2025-09-26 16:55:14
英特尔发布零售门店数字化赋能专项报告, 引领行业智能化升级
英特尔亮相第二十四届中国零售业博览会(China Shop 2024)。会上,英特尔发布了《零售门店数字化赋能专项报告(2024年)》。
至顶网
业界供稿 2024-03-14 09:10:53
人工智能的自学奇迹:清华大学研究团队开创"无师自通"的AI学习新方法
想象一下这个场景:一位学生拿到了一套没有标准答案的数学题。正常情况下,没有答案怎么知道自己做得对不对呢?大多数学生会卡在这一步。但如果这位学生非常聪明,他会想出一个办法——先用不同的解题思路做几遍,然后看哪个答案出现的次数最多,那个答案很可能就是正确的。接着,他会思考为什么其他方法得到了不同的答案,从而改进自己的解题技巧。这就是清华大学研究团队开发的"测试时强化学习"(TTRL)的核心思想。
至顶网
科技行者 2025-04-24 14:24:43
视觉语言模型能看懂色彩世界吗?马里兰大学推出全面评估色彩理解能力的COLORBENCH基准测试
你是否曾经因为衣服色彩搭配不协调而尴尬?或者在医学诊断试纸上辨别微妙的颜色变化时感到困惑?色彩在我们的日常生活中扮演着至关重要的角色,从科学发现到医疗保健,从购物到艺术欣赏,无处不在。而人工智能,特别是视觉语言模型(VLMs),正在迅速融入我们的生活,但它们真的能像人类一样理解和利用色彩信息吗?
至顶网
科技行者 2025-04-18 16:53:57
华为云潘捷:九类关键能力、六大解决方案,华为云助力车企数字化转型
2021年12月19日,在北京 · 北苑大酒店举办的“2021中关村数字经济产业联盟会员代表大会暨华为云北京城市峰会”的领跑汽车智能时代高峰论坛上,华为云中国区副总裁,云原生企业业务部部长潘捷发表演讲。
至顶网
业界供稿 2021-12-20 17:25:01
启动前先热身:如何在资源受限环境下激发AI大模型的通用推理能力
纽约大学阿布扎比分校研究团队提出了一种创新的两阶段训练方法,解决了AI领域的数据稀缺问题。他们首先让AI模型在简单的"骑士与恶棍"逻辑游戏中"热身",学习通用推理技能,然后再用少量特定领域数据进行强化学习。实验表明,这种方法不仅大幅提升了模型在数学、编程和多学科理解任务上的表现,还显著提高了样本效率,使用仅100个样本就能达到传统方法需要数千样本才能实现的效果。更重要的是,"热身"过的模型在适应特定领域后仍能保持跨领域的泛化能力,为资源受限环境下开发强大AI系统提供了实用策略。
至顶网
科技行者 2025-05-26 17:01:41
素描几笔就能找到关键点:加利福尼亚大学和萨里大学团队的跨模态AI识别突破
加利福尼亚大学和萨里大学研究团队开发了一种创新的AI系统,能够仅通过简单的手绘素描就在复杂照片中精确识别关键点。这项技术突破了传统机器学习需要大量同类数据的限制,实现了真正的跨模态学习。系统在动物关键点识别任务中达到了39%的
准确率
,超越现有方法约5个百分点,并且在真实手绘素描测试中表现稳定。该技术有望在生物学研究、医疗诊断、工业检测等多个领域找到广泛应用。
至顶网
科技行者 2025-07-21 14:37:54
VisuLogic:一个评估多模态大语言模型视觉推理能力的基准测试
想象一下,你正在参加一场智力测试。主考官给你看了一张图片,并要求你找出图案的规律,预测下一个图形会是什么样子。对我们人类来说,这种视觉推理任务虽然有难度,但通常还算可行——我们能够观察图案变化、识别规律,然后做出合理推测。
至顶网
科技行者 2025-04-25 14:17:31
ByteDance团队开发出首个多模态网页浏览AI测试基准:MM-BrowseComp,能看懂图像和视频的智能助手评估标准终于来了
ByteDance等机构联合发布的MM-BrowseComp是首个专门评估AI多模态网页浏览能力的测试基准。该研究包含224道需要综合处理文字、图像、视频信息的题目,测试结果显示即使是最先进的OpenAI o3模型也只达到29%的
准确率
,揭示了当前AI在多模态信息理解方面的技术短板,为未来AI发展指明了重要方向。
至顶网
科技行者 2025-09-09 10:55:38
Atlas:谷歌研究团队打造的"超级记忆师",让AI模型记住整个上下文而非单个词
Google研究团队推出Atlas,一种革命性的AI记忆优化模型,解决传统Transformer架构在处理长文本时的计算复杂度问题。Atlas通过三大创新:超线性容量的记忆模块、基于上下文而非单词的记忆优化、及使用Muon优化器的高效记忆管理,实现了在超长文本(10M)处理中保持80%以上的
准确率
。研究还提出DeepTransformers架构,作为传统Transformer的严格泛化版本,在语言建模和常识推理任务中展现出色性能。
至顶网
科技行者 2025-06-03 17:00:14
GPU集群助力百度为行业提供高效定制化AI训练和推理平台
在赋能行业的平台的背后,EasyDL依托于NVIDIA的Tesla GPU深度学习平台,搭建了用于深度学习模型训练(Training)和服务(Inference)阶段的GPU集群。
至顶网
业界供稿 2018-07-06 08:04:46
商汤科技用AI赋能遥感影像智能解译 推动空间智能
沈徽在以“智能视觉,看懂世界”为题的主题演讲中表示,如今人工智能技术已经快速渗透到各行各业,并且通过技术提升驱动生产力升级,不断为产业带来变革。
至顶网
业界供稿 2018-06-15 13:53:14
英特尔亮相2024中国零售业博览会,发布多项行业最新进展
英特尔亮相第二十四届中国零售业博览会(China Shop 2024)。会上,英特尔发布了《零售门店数字化赋能专项报告(2024年)》。
至顶网
业界供稿 2024-03-14 14:19:27
华为云AI院长峰会在黔举行 推动人工智能产学研创新发展
7月22日,第三届华为云AI院长峰会在贵安召开。多位中国工程院院士、中国科学院院士,以及来自国内近30所顶尖高校的60余名院长、教授、专家汇聚一堂,共同探讨人工智能发展的新趋势及新挑战,促进人工智能创新思想、技术、产业、应用、人才的集聚和落地。
至顶网
至顶网CIO与CTO频道 2022-07-22 17:20:16
蚂蚁智能凭证安全产品“光鉴”通过国家级机构测评,产品性能获权威认证
蚂蚁集团智能凭证安全产品全项通过信通院能力测评,获
最高
评级。
至顶网
至顶网软件与服务频道 2024-04-29 17:09:19
双头优化:一种简单高效的半监督式视觉-语言模型知识蒸馏方法
本研究提出了双头优化(DHO)框架,一种解决视觉-语言模型知识蒸馏中梯度冲突问题的创新方法。通过设计两个独立的预测头分别学习标记数据和教师信号,DHO有效缓解了传统单头方法中的梯度冲突,提升了特征学习质量。实验结果显示,DHO在ImageNet等11个数据集上一致超越基线方法,使用1%标记数据时较现有最佳方法提高了3%的
准确率
,同时参数量更少。此外,DHO支持推理时通过线性组合双头输出灵活调整模型表现,为半监督学习下的知识蒸馏提供了一种简单高效的解决方案。
至顶网
科技行者 2025-05-21 14:23:13
Pinecone 推出 AI 代理构建 API,简化 RAG 开发
Pinecone 推出了 Pinecone Assistant,一种 AI 智能助手构建 API 服务,旨在加速检索增强生成(RAG)应用的开发。该服务集成了向量搜索、模型编排和重排等功能,简化了 RAG 应用的构建过程。Pinecone Assistant 提供了优化的接口、自定义指令和多种文件格式支持,为开发者提供了灵活且高效的 AI 智能助手构建工具。
至顶网
BLOCKS & FILES 2025-01-24 17:14:58
NVIDIA团队揭秘:如何让AI既会解数学题又能写代码——AceReason-Nemotron 1.1的训练秘籍
NVIDIA研究团队揭示了训练AI模型同时掌握数学推理和编程能力的突破性方法。通过精心设计的监督学习和强化学习协同训练,他们发现仅用数学题训练就能显著提升编程能力。研究提出了温度调节、阶段性训练等关键技术,最终的AceReason-Nemotron 1.1模型在多项权威测试中达到业界领先水平,为AI跨领域能力发展提供了新范式。
至顶网
科技行者 2025-06-23 09:26:13
多模态大模型也会"不懂装懂"?港浸大团队揭秘AI如何学会说"我不知道"
香港浸会大学团队开发了HumbleBench,这是目前最大的AI幻觉评估基准,包含22,831个测试题,专门评估多模态大语言模型的"认知谦逊"能力。与传统只测试选择正确答案的基准不同,HumbleBench的每个问题都包含"以上都不对"选项,测试AI能否在不确定时诚实承认无知。研究发现即使最先进的AI模型表现也不理想,最好的模型
准确率
仅73%,在极端测试中甚至接近0%,揭示了当前AI系统"不懂装懂"的严重问题。
至顶网
科技行者 2025-09-26 13:56:34
马里兰大学推出DynaGuard:让AI守门员学会理解你的专属规则
马里兰大学研究团队推出DynaGuard,这是首个能理解用户自定义规则的AI守护模型。不同于只能识别预设类别的传统系统,DynaGuard能处理自然语言编写的任何规则,并提供详细解释帮助AI自我纠正。该模型基于40000个场景的DynaBench数据集训练,在传统安全任务和定制规则处理上都表现优异,为AI安全技术开辟了新方向。
至顶网
科技行者 2025-09-22 10:28:15
<
上一页
13
14
15
16
17
18
19
20
21
22
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号