搜索 bob直播软件苹果【網纸——YB233典CN—

GPT-4o真的能统一图像生成和理解吗？UCLA研究团队揭示多模态AI的"阿喀琉斯之踵"

UCLA研究团队通过三个维度的测试发现，GPT-4o虽然能生成高质量图像，但在抽象推理、规则遵循和逻辑判断方面存在严重局限。研究揭示了当前多模态AI"表面聪明，深层糊涂"的问题，挑战了关于统一视觉理解与生成能力的假设，为AI发展提供了重要警示。

至顶网科技行者 2025-07-15 10:09:53

华盛顿大学新发现：大型语言模型竟能看懂手语，背后原理令人惊叹

华盛顿大学研究团队发现，大型语言模型在未接受手语训练的情况下，竟然具备理解德语手语的能力。通过系统实验，他们证实了模型能够判断手语语法正确性，并进行手语与文字间的翻译。这种"涌现的多模态能力"源于模型对语言抽象结构的深度理解，为开发手语翻译技术和改善聋哑人群数字交流体验开启了新可能。

至顶网科技行者 2025-07-28 11:51:05

直击CoRL｜跨越“Sim-to-Real”天堑 NVIDIA解锁物理AI“全景图”

NVIDIA推出全新开源模型、仿真库、工作流，加速机器人研发进程。

至顶网毛烁 2025-09-30 12:13:55

XaaS的成功证明“一切即服务”的价值

IT消费化指的是消费者市场中引入的技术传播到企业级领域。IT消费化曾经是员工使用他们自己的智能手机和移动应用完成工作的一个例证。

至顶网 cio.com 2018-07-27 18:35:11

黄仁勋与扎克伯格做了一场关于Meta生成式AI未来的探讨（附对话实录）

英伟达CEO黄仁勋和Meta CEO马克·扎克伯格，在美国丹佛举行的第50届SIGGRAPH图形大会上进行了一场关于生成式AI的对话，并且他们还互赠了皮衣。

至顶网王聪彬 2024-07-30 16:38:56

这篇研究提出了OThink-R1，一种创新的大型推理模型，能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现，现有推理模型即使面对简单问题也会生成冗长的推理过程，导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理，OThink-R1能根据问题复杂度动态调整思考深度。实验表明，该方法平均减少了23.4%的生成文本量，同时保持或提高了准确率，代表了向更高效、更人性化AI推理系统迈出的重要一步。

至顶网科技行者 2025-06-07 08:30:07

《华盛顿邮报》的转型心得：让出版平台成为新的收入驱动因素

Shailesh Prakash的职业生涯并非起步于媒体集团。在加入《华盛顿邮报》之前，他曾经在Sun Microsystems、网景以及微软等多家以技术为中心的企业工作过。

至顶网 Forbes 2019-05-05 18:13:45

英特尔首届AI开发者大会：秀出AI芯片和AI能力

英特尔今日在美国旧金山举行了首届Artificial Intelligence (AI) Developers Conference人工智能开发者大会，向800名AI极客和媒体等观众展现了自己在该领域的领导力、技术和赢得的客户。

至顶网 Forbes 2018-06-04 15:46:25

从呼噜声到语法：探索如何在合作觅食中产生语言 - A*STAR与南洋理工研究团队的突破性发现

这项由新加坡和英国研究机构联合进行的研究，使用多智能体强化学习探索了语言起源问题。研究团队设计了"觅食游戏"环境，让智能体在部分可观察的世界中协作完成任务。结果表明，智能体自发发展出具有人类语言五大特性的通信系统：任意性、互换性、位移性、文化传播和组合性。研究提供了关于语言如何在合作环境中自然演化的新见解，证明语言是从社会互动和共享目标中浮现的工具，而非孤立系统。

至顶网科技行者 2025-05-23 07:42:55

伊利诺伊大学新突破：让AI像搭积木一样改变照片中的物体位置

伊利诺伊大学研究团队开发出"生成式积木世界"系统，通过将照片分解成3D几何积木，让用户能够直观地编辑图像中物体的位置、大小和角度，同时保持原有质感。该技术突破了传统图像编辑在3D空间操作上的限制，为专业设计和普通用户提供了全新的创作工具。

至顶网科技行者 2025-07-01 14:15:47

智能"放大镜"：NVIDIA与UC Berkeley联手打造的图像视频精准描述新技术

想象一下，你正在浏览一张复杂的家庭聚会照片，想向视力障碍的朋友描述照片中特定人物的表情和姿态，或者你需要从监控视频中准确描述某个可疑物体的细节。在这些场景中，我们不仅需要描述整张图片或整段视频，更需要聚焦于特定区域，提供精确而详细的描述。

至顶网科技行者 2025-04-24 14:23:27

成均馆大学团队破解AI如何理解人类交互意图：让机器像人一样学会物体可供性

成均馆大学团队开发出选择性对比学习新方法，让机器通过观察人类交互场景学会识别物体功能部位。该技术突破传统局限，采用动态学习策略，能根据信息质量调整学习方式，在多个数据集上显著超越现有方法，为机器人、自动驾驶等领域的智能交互应用奠定重要基础。

至顶网科技行者 2025-08-29 14:09:31

星展银行坚持以人为本率先运用AI与ML技术

星展银行首席数据与转型官Nimish Panchmatia谈起这家新加坡银行的成功转型时，给出了与其他银行技术专家类似的见解：“我们以客户为中心、永远将客户放在首位的心态，可能才是实现成功的最大因素之一。”

至顶网至顶网CIO与CTO频道 2022-12-07 12:13:48

2018汉诺威工博会|当市值最高的亚马逊遇见展位最大的西门子

2018年汉诺威工博会吸引了来自75个国家和地区5000多家参展商，堪称“工业4.0”全球大阅兵的舞台。今年，两家巨头奇妙地联系在了一起——西门子物联网操作系统被部署在亚马逊云计算平台上。

至顶网 CSDN 2018-05-02 17:53:01

使用Llama.cpp在家中私密运行大语言模型

本文详细介绍了如何使用Llama.cpp在个人电脑上本地运行大语言模型。内容涵盖了Llama.cpp的安装配置、模型部署、性能优化、量化压缩、推测解码、工具调用等核心功能。文章指出虽然训练大模型需要巨额投资，但运行已训练好的模型在普通硬件上是完全可行的。通过Llama.cpp，用户可以获得无限制的本地AI服务，避免数据上传云端，同时享受更好的性能和更多定制选项。

至顶网 The Register 2025-08-26 10:17:16

裸眼3D显示器，联想的又一元宇宙入口

从2D显示到3D显示，曾被互联网“弄丢”的那个维度，正在被逐渐补全。

至顶网金旺 2023-11-21 09:18:52

《黑莓》导演谈iPhone为何胜出，以及为何多数科技电影都是烂片

“现在一股新的文化浪潮居然想要重复黑莓当初走过的道路，真是太奇怪了。”

至顶网 The Verge 2023-05-12 10:27:16

阿里巴巴的“兴农扶贫”之路：公益心态出发，商业手法做事

科技行者推出《电商助农》选题，独家访谈中国各大电商，挖掘电商助农背后的故事。希望借此选题，探讨如何通过电商为主的科技手段如何推动农村经济增长，推动农村新基础设施建设，推动数字经济平衡发展，最终实现精准扶贫。此为阿里巴巴篇。

至顶网倪世新周雅 2019-04-22 18:31:02

智能手机之后是万物时代

“操作系统是计算终端的灵魂，用户界面是操作系统的灵魂。”

至顶网高飞 2020-01-13 15:32:44

盘点：2020年最炙手可热的10家半导体初创公司

当英特尔、AMD和Nvidia还在相互拼杀的时候，已经涌现了很多家初创公司，要么向这些半导体巨头们发起了挑战，要么提供了替代性硬件可以改善系统的整体经济效益。

至顶网 CRN 2020-12-02 17:21:25