搜索 bob这个平台怎么样【網纸——YB233典CN—

AI被最新"空间推理"题目难倒了！EPFL和ETH科学家打造地狱级多模态测试，所有顶级模型全军覆没

瑞士EPFL和ETH研究团队发布MARBLE基准测试，专门评估AI的复杂空间推理能力。测试包含Portal游戏启发的M-Portal和3D拼图M-Cube两大任务，要求AI进行多步骤规划和3D空间组装。结果显示包括GPT-4o在内的12个顶级多模态AI模型几乎全部失败，在最难任务上准确率接近0%，暴露了当前AI在真正智能推理方面的重大缺陷。

至顶网科技行者 2025-07-03 10:00:33

对机器人征税，它们就不来抢你的工作了吗？

麻省理工学院经济学家Arnaud Costinot与Iván Werning探讨拟议的“机器人税”。

至顶网 TechCrunch 2023-09-15 08:29:32

医疗行业的AI应用，要避免“垃圾进、垃圾出”

人工智能在医疗保健行业中的应用是一场马拉松，而不是短跑。

至顶网科技行者 2020-07-15 14:35:03

香港中文大学团队首次让AI绘画也能像人类一样"边画边思考"

香港中文大学团队首次将"链式思维推理"技术应用于AI绘画领域，教会AI像人类画家一样"边画边思考"。通过开发专门的PARM评估模型和多种训练策略，让AI绘画在复杂场景描述上提升24%，超越知名的Stable Diffusion 3模型15%。这项突破为AI创作工具带来更智能的"自我反思"能力。

至顶网科技行者 2025-09-16 10:31:11

Gartner：云文件服务之战已然打响

下一代文件平台具有“强调集成和运用公有云”等特征。

至顶网至顶网存储频道 2023-05-04 09:37:32

8月小考，一张属于英特尔FPGA中国创新中心的成绩单

在《复仇者联盟》这样的电影中，英雄似乎都不是一个人在战斗。有条不紊才是最好的节奏。

至顶网黄当当 2019-09-03 16:31:14

多模态大模型也会"不懂装懂"？港浸大团队揭秘AI如何学会说"我不知道"

香港浸会大学团队开发了HumbleBench，这是目前最大的AI幻觉评估基准，包含22,831个测试题，专门评估多模态大语言模型的"认知谦逊"能力。与传统只测试选择正确答案的基准不同，HumbleBench的每个问题都包含"以上都不对"选项，测试AI能否在不确定时诚实承认无知。研究发现即使最先进的AI模型表现也不理想，最好的模型准确率仅73%，在极端测试中甚至接近0%，揭示了当前AI系统"不懂装懂"的严重问题。

至顶网科技行者 2025-09-26 13:56:34

四位CIO畅谈：避免被实施合作伙伴带进坑里的七种方法

对很多企业来说，实施合作伙伴为CIO提供了在部署解决方案方面的广泛经验和专业知识，让CIO们可以把合作伙伴积累的经验用于他们的项目实施过程中，以避免常见的错误并且节省大量的时间和精力

至顶网至顶网CIO与CTO频道 2022-10-09 10:24:59

行家论道：“双碳”战略背景下，零碳智慧园区的未来将走向何方？

如今，园区作为一个城市的关键单元，降低能耗、减少碳排放助力“双碳”达标，已经成为各个园区的关注重点。对园区的要求是不仅要智慧还要绿色，也就是要向着“零碳智慧园区”持续演进。

至顶网邹大斌 2021-11-10 12:06:52

数字世界“网事”，一颗芯如何做到润物细无声？

互联网如何走过了从“高分贝的猫语”到“丝滑无声上网”？

至顶网周雅 2023-11-16 21:27:02

极限挑战武汉东湖高新区“秒建”社区视频会议系统

2020年2月，武汉东湖高新区决定紧急扩容应急指挥系统，依托现有应急指挥系统，通过横向扩容平台接入容量，纵向向下扩容社区接入点，向上对接市级应急指挥系统，搭建市-区-街道-社区的四级指挥架构，实现全高清的视频沟通，大幅提高工作效能。

至顶网业界供稿 2020-03-13 12:05:06

跨越语言与文化的鸿沟：VideoVista-CulturalLingo视频理解评测基准的突破性研究

想象一下，你有一位智能助手，它能够理解各种视频内容并回答你的问题。你给它看一段关于中国传统节日的视频，问它"这个节日人们通常会吃什么食物？"。如果这个助手主要是"看过"西方文化背景的视频，它很可能会对中国文化相关的问题感到困惑。

至顶网科技行者 2025-04-29 12:24:58

为什么“玩鞋”的人都跑去玩NFT了？

数字「NFT」之风，也刮到了引领潮流文化发展的「鞋圈」。

至顶网黄当当 2022-08-01 12:17:36

谷歌DeepMind团队揭秘：AI如何像人类一样"看图说话"理解复杂世界

谷歌DeepMind团队开发了名为Gemini的AI视觉理解系统，实现了从简单"识别"到复杂"理解"的突破。该系统不仅能识别图像中的物体，还能理解情感、关系和抽象概念，准确率达94.3%。通过多模态学习和跨模态注意力网络，Gemini展现出类似人类的常识推理能力，已在医疗、教育、自动驾驶等领域开始应用，为AI与人类协作开启新篇章。

至顶网科技行者 2025-08-20 10:25:56

有机奶企圣牧高科：从沙漠中走来，向智慧农场走去

一杯牛奶从牧场到消费者手中，将有大量环节可以被数字化。

至顶网高玉娴 2020-09-16 16:07:44

泽塔云郑经波：超融合不是终点，IT基础架构会持续创新

从蒸汽火车到内燃机火车，从内燃机火车到动车、高铁。每一次技术的进步，都让交通速度和体验得到了质的飞跃，为用户提供了更多的便利。

至顶网业界供稿 2018-05-30 10:11:44

告别繁琐优化：东卡罗来纳大学团队让3D高斯点云风格转换变得像变魔术一样简单

东卡罗来纳大学研究团队开发出一种革命性的3D高斯点云风格转换技术，无需重建或优化即可将任意风格应用到3D场景。通过构建表面图形网络，该方法将2D风格转换技术巧妙移植到3D空间，处理速度从传统的20分钟到3小时缩短至1-2分钟，且可在普通消费级硬件运行，为3D内容创作带来前所未有的便利性。

至顶网科技行者 2025-08-15 08:50:01

Fortinet：网络和安全融合的领军者

近日，Fortinet 核心操作系统的演进暨 Fortinet SD-WAN 在2021年度Gartner 广域网边缘基础设施魔力象限的位置及其关键能力与场景宣讲成功举办。

至顶网业界供稿 2021-11-02 10:29:15

华为云“微光计划”训练营上海站，开营在即！

“微光训练营”由华为云联合全国产业云创新中心共同发起，主要目的是帮助和加速科技初创企业、生态伙伴业务成长，扶持计划为初创企业提供专家资源、技术研讨等培训支持，提供包括云计算、5G、大数据、边缘计算等方向的技术支持等

至顶网业界供稿 2021-07-08 19:15:14

OpenAI 发布迄今最大规模的 AI 模型 GPT-4.5 "Orion"

OpenAI 推出代号"Orion"的 GPT-4.5 模型，这是公司迄今最大规模的 AI 模型。GPT-4.5 在计算能力和训练数据方面均超越以往版本，但 OpenAI 并不认为它是前沿模型。该模型将逐步向付费用户开放，但运营成本高昂。尽管在某些基准测试中表现出色，但 GPT-4.5 在部分任务上仍落后于其他 AI 推理模型，凸显了传统预训练方法的局限性。

至顶网 Techcrunch 2025-02-28 09:42:25