搜索宝宝计划手机版软件【網纸——YB233典CN—

港科大推出LazyDrag：一招搞定图片编辑难题，不用训练就能让照片"听话"

港科大研究团队开发的LazyDrag系统创新性地解决了图片拖拽编辑中的核心难题。该系统摒弃传统的隐式匹配方法，采用显式对应地图技术，实现了无需训练的高精度图片编辑。LazyDrag支持文字引导功能，能智能理解用户意图，在准确性和感知质量方面全面超越现有方法，为AI辅助图片编辑开辟了新方向。

至顶网科技行者 2025-09-28 11:00:01

机器人终于学会"预测未来"：上海AI实验室开发出能看到下一秒的智能机器人大脑

上海AI实验室开发的F1机器人"大脑"实现了革命性突破，让机器人首次具备"预见未来"的能力。通过理解、生成、执行三个专家模块协作，F1能预测任务执行后的画面并据此制定行动策略。在多个机器人平台测试中，F1的成功率大幅超越传统方法，特别是在动态环境和长期规划任务中表现卓越，为机器人智能化发展开辟了新道路。

至顶网科技行者 2025-09-23 10:01:56

麻省理工学院新突破：让AI不再"健忘"，打造永不停歇的智能伙伴

麻省理工学院研究团队开发出让AI拥有"永久记忆"的突破性技术，通过长期记忆增强生成系统解决了传统AI"健忘"问题。该技术能让AI记住用户偏好和历史对话，实现真正个性化交互。实验显示记忆准确率达85%，一致性94.2%，为AI从工具向智能伙伴转变奠定基础，有望在教育、客服、个人助理等领域产生深远影响。

至顶网科技行者 2025-09-18 13:52:17

Mistral AI首次推出推理模型Magistral：纯强化学习训练让AI学会"深度思考"

Mistral AI首次推出推理模型Magistral，采用纯强化学习训练让AI学会深度思考。该模型在数学推理能力上提升近50%，能够展示完整思考过程，并意外获得多模态推理能力提升。研究团队开源了Magistral Small模型，为AI推理能力发展开辟新路径，证明了强化学习在培养AI思维能力方面的巨大潜力。

至顶网科技行者 2025-06-18 09:20:58

上海人工智能实验室发布全球首个世界探索视频数据集：让AI像人类一样"环游世界"

上海人工智能实验室联合多个机构发布了名为Sekai的全球首个世界探索视频数据集，包含超过5000小时来自101个国家750个城市的第一人称视角视频。数据集配备位置、天气、场景等丰富标注，并基于此训练了YUME交互式世界探索模型，用户可通过键盘鼠标控制虚拟世界漫游，为虚拟旅游、教育、游戏等领域开辟新应用前景。

至顶网科技行者 2025-06-24 15:42:41

亚马逊首席技术官预测2021：八大技术趋势改变世界

2020年12月18日，在为期三周的亚马逊re:Invent全球大会即将闭幕之际，亚马逊全球副总裁、首席技术官Werner Vogels博士发表压轴演讲，分享了他对2021年的科技趋势的预测。

至顶网至顶网CIO与CTO频道 2020-12-22 10:13:51

美团研究院打造超级GUI助手：让电脑和手机像人类一样"看懂"屏幕并自动操作

美团研究团队推出突破性GUI操作AI系统UItron，能够像人类一样理解屏幕内容并自动执行复杂操作任务。该系统采用三段式训练方法，在多项标准测试中表现卓越，特别是在中文应用场景下达到54.1%的任务成功率，显著超越其他同类系统。研究团队收集了超过一百万步中文应用操作数据，为GUI代理在中文环境的实际应用奠定了基础。

至顶网科技行者 2025-09-05 10:13:57

CAMEL-AI发布"龙"项目：让AI像人类一样深度思考推理

CAMEL-AI团队发布的Loong项目通过构建包含8729道题目的LOONGBENCH数据集和LOONGENV生成环境，实现了AI推理能力的大规模训练。该系统能自动生成验证推理题目，支持12个领域的深度推理训练，为AI从模式匹配向真正推理能力转变提供了完整解决方案。

至顶网科技行者 2025-09-22 14:54:31

把大象带到中国，一共需要几步？

印象笔记宣布脱离Evernote全球业务，成为第一个独立于母公司的中国互联网公司，这很容易让人想起这个关于大象的冷笑话——把印象笔记这样“一头大象”带回中国一共经历了几个步骤

至顶网业界供稿 2018-07-13 14:28:35

学了七年计算机，我没换来一个初级程序员工作，也没实现留在国外的梦

2022年的高考刚落下帷幕，填报志愿又成为了另一个战场，牵系着每个家庭的心，其中最受瞩目的就是那些热门专业。选择热门专业往往意味着未来会有更多的工作机会、更高的收益回报，但这样真的就等于选择了一条正确的道路吗？

至顶网尼酱 2022-07-06 11:13:05

声音变视频：Captions公司推出能听会说的AI导演Mirage

Captions公司推出的Mirage是一项革命性的AI视频生成技术，仅通过音频就能生成完全匹配的说话视频。该技术采用先进的扩散模型，能够分析音频中的语调、节奏和情感信息，转换为自然流畅的视频内容。Mirage在嘴唇同步准确率和面部表情自然度方面表现出色，为教育培训、内容创作、企业宣传等领域提供了低成本、高效率的视频制作解决方案，有望推动整个数字内容创作行业的变革。

至顶网科技行者 2025-08-22 10:52:26

Meta发布Llama3.1，OpenAI推出AI搜索SearchGPT，Deepmind获得奥数银牌，这就是这周的AI大新闻。

Llama3.1 版本模型提供了更好的推理能力、更大的 128K token 上下文窗口，并改进了对8种语言的支持。

至顶网数字生命卡兹克 2024-07-30 13:04:30

AI智能机器人如何学会团队合作：莫斯科科学家发明记忆共享技术让机器人告别"各自为政"

俄国科学家开发出共享记忆变换器（SRMT）技术，通过让机器人共享记忆而非直接通信来实现协作。该技术受人类大脑全局工作空间理论启发，让每个机器人都能访问共同的记忆池。在多项测试中，SRMT显著优于传统协作方法，特别是在稀疏奖励环境下表现突出，并展现出优异的泛化能力。该技术有望应用于物流仓库、自动驾驶、搜救等需要多智能体协调的实际场景。

至顶网科技行者 2025-09-18 10:26:32

蒙特利尔理工大学重磅推出：让AI也能像人类一样"看懂"复杂表格的神奇数据集

蒙特利尔理工大学研究团队开发了Visual-TableQA数据集，通过多AI协作生成2500个复杂表格和6000个推理问答对，仅成本不到100美元。该数据集专门训练AI理解表格图像的视觉布局和复杂推理，实验显示微调后的模型在多个基准测试中超越专有模型，为AI视觉推理能力带来重大突破。

至顶网科技行者 2025-09-26 13:55:11

谷歌DeepMind团队让Gemini 2.5学会"读懂"卫星多光谱图像：无需训练的零样本遥感革命

谷歌DeepMind团队创新性地让Gemini 2.5模型在无需训练的情况下学会理解卫星多光谱图像。他们将复杂的12波段卫星数据转换为6张可理解的伪彩色图像，配以详细文字说明，使通用AI模型能够准确分析遥感数据。在多个基准测试中超越现有模型，为遥感领域AI应用开辟了全新道路。

至顶网科技行者 2025-10-13 15:14:26

疫情之下被互联网镌刻的共同记忆——“这漫长的宅家生活”

这些再平凡不过的故事，被互联网冠上了统一的社会记忆，一下子变得深邃而迷人。

至顶网周雅 2020-02-14 09:43:34

从技术乌托邦到问题显微镜，AI for Good正在落到实处

他们的故事揭示了一个被低估的事实：AI向善的最好载体，或许就藏工业流水线、医疗手术台、田间农作物等真实世界场景的细枝末节里。

至顶网周雅 2025-03-10 17:28:43

NVIDIA推出颠覆性研究工具：让任何人都能定制自己的AI研究助手

NVIDIA Research推出了革命性的UDR系统，让用户可以完全自定义AI研究助手的工作策略。该系统解决了传统研究工具固化、难以专业化定制的问题，支持任意语言模型，用户可用自然语言编写研究策略，系统自动转换为可执行代码。提供三种示例策略和直观界面，实现了AI工具的民主化定制，为专业研究和个人调研提供了前所未有的灵活性。

至顶网科技行者 2025-09-19 11:08:03

上海AI实验室推出超级评委AI：让机器像人类专家一样评判文本质量

上海AI实验室推出CompassJudger-2，这是一个能够像人类专家一样评判文本质量的AI模型。通过创新的批判性思考训练方法和高质量数据处理，这个7B参数的模型在多个评估基准中超越了更大规模的竞争对手，展现出专业化训练的威力。

至顶网科技行者 2025-07-22 09:23:26

800个书呆子（Nerd），如何在邮轮上办一场亚文化的趴体？

这是我跟“书呆子”们共度的一段旅程，这场游轮探险不只是对极客文化的致敬，更是对经典社会等级的彻底颠覆。

至顶网海外来电 2022-12-11 16:24:48