搜索 bob是什么意思译【網纸——YB233典CN—

让AI看图"动起来"：上海交大与上海人工智能实验室打造会搜索会写代码的多模态智能助手

2025年5月20日，上海交通大学与上海人工智能实验室合作发布了"视觉智能体强化微调"（Visual-ARFT）研究，使AI模型能像人类一样主动使用搜索引擎和编写代码处理图像。这项突破性技术通过强化学习让大型视觉-语言模型获得工具使用能力，在研究团队设计的多模态智能体工具基准（MAT）上表现优异，甚至超越了GPT-4o。经过训练的模型能够分析问题、分解任务、调用工具并解决复杂视觉问题，为构建能真正"用图像思考"的AI智能体开辟了新路径。

至顶网科技行者 2025-05-26 17:50:28

数字化转型下一站，HPE GreenLake重新定义混合云

在过去几年,数字化转型的呼声很高,但大多数是各大技术厂商从各自技术产品推广角度而发出的声音,企业真正需要的是能够兼备各种云技术并能高效、快速、低成本落地的数字化转型整体方案。

至顶网业界供稿 2021-04-15 15:10:51

SRPO：通过反思增强强化学习，让多模态大语言模型推理能力更上一层楼

该研究提出了SRPO框架，一种两阶段反思感知强化学习方法，用于增强多模态大语言模型的推理能力。通过构建高质量的反思数据集进行监督微调，并设计专门的奖励机制鼓励有效反思，SRPO成功解决了现有模型在复杂推理任务中缺乏自我反思和自我纠错能力的问题。实验表明，SRPO在MathVista等多个基准测试上显著优于现有最先进模型，证明了反思导向训练可以有效扩展模型的推理能力边界。

至顶网科技行者 2025-06-05 15:21:11

上海人工智能实验室开发VRBench：首个专门评估AI看长视频推理能力的测试平台

这项由上海人工智能实验室、南京大学和中科院深圳先进技术研究院联合完成的研究，开发了全球首个专门测试AI长视频推理能力的评估平台VRBench。该平台包含1010个多语言长视频和超过9000个多步推理问答对，创新性地采用双重评估机制，既测试AI的答案准确性，也评估推理过程质量。测试结果显示，即使是最先进的AI模型在复杂视频推理任务上仍存在显著不足，特别是推理过程的可靠性方面。

至顶网科技行者 2025-06-17 14:36:41

Tungsten Fabric：连接CMP的金钥匙

本文整理自上海数讯CIO钱誉在TF中文社区“2020第一次Meetup”上的演讲,分享早期云网络实际应用和二次开发过程中的经验教训。

至顶网业界供稿 2020-02-26 10:54:40

中国电信5G闪耀上海世界移动大会

2019年6月26日，2019世界移动大会在上海开幕。中国电信以“你的智慧未来”为主题，展出智慧家庭、智慧社区、智慧城市、智慧工业、云网融合5大板块、28个展项。

至顶网科技行者 2019-06-26 09:45:17

清华大学推出革命性视频生成技术：让AI看懂"注意力"背后的秘密

清华大学团队通过创新的"模式感知重排序"技术，解决了AI视频生成中注意力机制计算效率低下的问题。该技术将复杂分散的注意力模式重新整理成规整的块状结构，结合专门设计的稀疏化和量化策略，在保持生成质量的同时将计算速度提升1.9-2.7倍，为AI视频生成的普及应用铺平道路。

至顶网科技行者 2025-06-25 11:37:56

这18个月您可能错过的45条Dell EMC新闻

将这45条新闻连起来看，您会发现Dell EMC一刻不停的创新脚步。通过整合原有两家公司的优势技术，Dell EMC力图为客户提供更优化、更完善的解决方案，更好地助力客户的数字化转型。

至顶网 Dell 2018-03-09 15:58:07

Iwin Transformer：上海交通大学提出的无位置编码视觉变换器，让AI看图更聪明

上海交通大学研究团队提出Iwin Transformer，这是一种无位置编码的分层视觉变换器，通过创新的交错窗口注意力和深度可分离卷积协作，能直接从低分辨率微调到高分辨率。该方法用注意力连接远程令牌，用卷积连接邻近令牌，在单模块内实现全局信息交换，克服了Swin Transformer需要两个连续块的局限。在ImageNet-1K上达到87.4%准确率，在语义分割和视频识别等任务中表现出色。

至顶网科技行者 2025-07-29 17:16:23

主动感知：浙江大学团队ACTIVE-O3让多模态大语言模型"学会看哪里"

浙江大学和蚂蚁集团的研究团队开发了ACTIVE-O3，一种创新框架，赋予多模态大语言模型"主动感知"能力，使AI能够智能地决定"看哪里"和"怎么看"。基于群体相对策略优化(GRPO)构建，该系统采用两阶段策略，先选择关注区域，再执行任务。实验表明，ACTIVE-O3在小物体检测、密集物体定位和交互式分割等任务上显著优于现有方法，并展示出强大的零样本推理能力。该研究为AI系统提供了更接近人类认知的视觉探索能力，对自动驾驶、医疗诊断等领域具有重要应用价值。

至顶网科技行者 2025-05-31 10:05:58

从OpenAI出走，到成为AI独角兽：Anthropic诞生的完整故事，以及5条“经验之谈”

本文讲述了几个创始人从OpenAI出走，带着一套“AI必须讲道德”的理念，创立了Anthropic这家公司，并培养了（他们说的）“AI界最正直的公民”Claude。

至顶网周雅 2025-04-09 21:37:28

西班牙和芬兰顶尖大学联合揭示：人工智能绘画界的"破案神探"其实是个近视眼

这项由多国顶尖大学联合完成的研究，通过测试六个先进AI模型对近4万幅画作的识别能力，揭示了当前人工智能在艺术鉴定领域的严重局限。研究发现，即使最优秀的AI模型准确率也仅有60%，且无法识别《蒙娜丽莎》等世界名画，同时容易被某些AI生成的仿制品"欺骗"。

至顶网科技行者 2025-08-07 14:19:38

微软联合创始人保罗.艾伦：一个极富创造力的程序员，一个“理想主义者”

在与22岁的比尔.盖茨共同创立微软8年之后，保罗.艾伦选择了离开。这位一手创造出美国历史上最大财富象征之一「微软」的传奇人物于本周一在西雅图去世，享年65岁。他曾是一个极富创造力的程序员，也是一个“理想主义者”。

至顶网科技行者 2018-10-17 14:38:41

拼多多的“助农”故事：帮农民卖农货是我们的基因

科技行者推出《电商助农》选题，独家访谈中国各大电商，挖掘电商助农背后的故事。此为拼多多篇。

至顶网倪世新周雅 2019-04-17 12:18:48

加速应用迁移、使能原生开发，鲲鹏开发套件DevKit能力再升级

做过应用迁移的都知道，基于传统平台的应用软件迁移到新的创新架构平台，要考虑众多因素

至顶网任新勃 2022-11-26 15:28:09

IBM：“智慧商业”的黎明时刻来了

在今年1月份发布的2017年财报中，IBM终结了连续22个季度的收入下滑。据此，罗睿兰表示，IBM的转型已经“完成”，该是“加速”的时候了。这个自信的论断，既宣告了IBM阶段性转型的完成，同时也宣告了下一个时代的到来。这个时代正是智慧商业的“黎明时刻”。

至顶网高玉娴 2018-04-13 18:09:37

控制随心，视频随意：ByteDance智能创作的ATI轨迹控制系统如何彻底改变视频生成技术

ByteDance智能创作团队推出的ATI系统彻底改变了视频生成技术的控制方式。这个统一框架通过简单的点轨迹同时实现相机移动、物体平移和局部变形控制，不再需要分散的工具。用户只需在初始图像上标记关键点并绘制运动路径，系统就能生成符合指令的高质量视频。研究表明，ATI不仅提高了控制精度，还能兼容多种顶级视频生成模型，有望让专业级视频创作变得更加直观简单。

至顶网科技行者 2025-06-04 11:15:24

大数据＋AI能与碳中和扯上关系？看这家新能源企业如何操作

当AI进入落地期，认真思考如何打通大数据与AI应用的关联，才是企业眼前既现实、又关键的一大挑战。

至顶网业界供稿 2021-07-15 09:47:28

小模型也能做大事！这个1.2B参数的AI模型如何在推理任务上超越众多竞争对手

小豆科技发布的Xmodel-2是一个专门针对推理任务优化的12亿参数语言模型。通过创新的张量程序架构、WSD学习率调度和数据配比优化，该模型在复杂推理和智能代理任务上表现卓越，超越了许多同规模模型。经1.5万亿token训练，模型已开源，为资源有限的开发者提供了高效的推理工具，在客服自动化等应用中展现出巨大潜力。

至顶网科技行者 2025-09-12 19:46:53

论数据中心芯片领域正在发生的那些变迁

在今天的文章中，我们将着眼于这几家企业，并尝试解读这个“激情四射的芯片之夏”。

至顶网 Forbes 2019-06-18 15:14:52