搜一下
用了 0.133602秒,为您找到
宝宝
计划
手机
软件
網纸
YB233
相关内容12593 条
港科大推出LazyDrag:一招搞定图片编辑难题,不用训练就能让照片"听话"
港科大研究团队开发的LazyDrag系统创新性地解决了图片拖拽编辑中的核心难题。该系统摒弃传统的隐式匹配方法,采用显式对应地图技术,实现了无需训练的高精度图片编辑。LazyDrag支持文字引导功能,能智能理解用户意图,在准确性和感知质量方面全面超越现有方法,为AI辅助图片编辑开辟了新方向。
至顶网
科技行者 2025-09-28 11:00:01
机器人终于学会"预测未来":上海AI实验室开发出能看到下一秒的智能机器人大脑
上海AI实验室开发的F1机器人"大脑"实现了革命性突破,让机器人首次具备"预见未来"的能力。通过理解、生成、执行三个专家模块协作,F1能预测任务执行后的画面并据此制定行动策略。在多个机器人平台测试中,F1的成功率大幅超越传统方法,特别是在动态环境和长期规划任务中表现卓越,为机器人智能化发展开辟了新道路。
至顶网
科技行者 2025-09-23 10:01:56
麻省理工学院新突破:让AI不再"健忘",打造永不停歇的智能伙伴
麻省理工学院研究团队开发出让AI拥有"永久记忆"的突破性技术,通过长期记忆增强生成系统解决了传统AI"健忘"问题。该技术能让AI记住用户偏好和历史对话,实现真正个性化交互。实验显示记忆准确率达85%,一致性94.2%,为AI从工具向智能伙伴转变奠定基础,有望在教育、客服、个人助理等领域产生深远影响。
至顶网
科技行者 2025-09-18 13:52:17
Mistral AI首次推出推理模型Magistral:纯强化学习训练让AI学会"深度思考"
Mistral AI首次推出推理模型Magistral,采用纯强化学习训练让AI学会深度思考。该模型在数学推理能力上提升近50%,能够展示完整思考过程,并意外获得多模态推理能力提升。研究团队开源了Magistral Small模型,为AI推理能力发展开辟新路径,证明了强化学习在培养AI思维能力方面的巨大潜力。
至顶网
科技行者 2025-06-18 09:20:58
上海人工智能实验室发布全球首个世界探索视频数据集:让AI像人类一样"环游世界"
上海人工智能实验室联合多个机构发布了名为Sekai的全球首个世界探索视频数据集,包含超过5000小时来自101个国家750个城市的第一人称视角视频。数据集配备位置、天气、场景等丰富标注,并基于此训练了YUME交互式世界探索模型,用户可通过键盘鼠标控制虚拟世界漫游,为虚拟旅游、教育、游戏等领域开辟新应用前景。
至顶网
科技行者 2025-06-24 15:42:41
亚马逊首席技术官预测2021:八大技术趋势改变世界
2020年12月18日,在为期三周的亚马逊re:Invent全球大会即将闭幕之际,亚马逊全球副总裁、首席技术官Werner Vogels博士发表压轴演讲,分享了他对2021年的科技趋势的预测。
至顶网
至顶网CIO与CTO频道 2020-12-22 10:13:51
美团研究院打造超级GUI助手:让电脑和
手机
像人类一样"看懂"屏幕并自动操作
美团研究团队推出突破性GUI操作AI系统UItron,能够像人类一样理解屏幕内容并自动执行复杂操作任务。该系统采用三段式训练方法,在多项标准测试中表现卓越,特别是在中文应用场景下达到54.1%的任务成功率,显著超越其他同类系统。研究团队收集了超过一百万步中文应用操作数据,为GUI代理在中文环境的实际应用奠定了基础。
至顶网
科技行者 2025-09-05 10:13:57
CAMEL-AI发布"龙"项目:让AI像人类一样深度思考推理
CAMEL-AI团队发布的Loong项目通过构建包含8729道题目的LOONGBENCH数据集和LOONGENV生成环境,实现了AI推理能力的大规模训练。该系统能自动生成验证推理题目,支持12个领域的深度推理训练,为AI从模式匹配向真正推理能力转变提供了完整解决方案。
至顶网
科技行者 2025-09-22 14:54:31
把大象带到中国,一共需要几步?
印象笔记宣布脱离Evernote全球业务,成为第一个独立于母公司的中国互联网公司,这很容易让人想起这个关于大象的冷笑话——把印象笔记这样“一头大象”带回中国一共经历了几个步骤
至顶网
业界供稿 2018-07-13 14:28:35
学了七年计算机,我没换来一个初级程序员工作,也没实现留在国外的梦
2022年的高考刚落下帷幕,填报志愿又成为了另一个战场,牵系着每个家庭的心,其中最受瞩目的就是那些热门专业。 选择热门专业往往意味着未来会有更多的工作机会、更高的收益回报,但这样真的就等于选择了一条正确的道路吗?
至顶网
尼酱 2022-07-06 11:13:05
声音变视频:Captions公司推出能听会说的AI导演Mirage
Captions公司推出的Mirage是一项革命性的AI视频生成技术,仅通过音频就能生成完全匹配的说话视频。该技术采用先进的扩散模型,能够分析音频中的语调、节奏和情感信息,转换为自然流畅的视频内容。Mirage在嘴唇同步准确率和面部表情自然度方面表现出色,为教育培训、内容创作、企业宣传等领域提供了低成本、高效率的视频制作解决方案,有望推动整个数字内容创作行业的变革。
至顶网
科技行者 2025-08-22 10:52:26
Meta发布Llama3.1,OpenAI推出AI搜索SearchGPT,Deepmind获得奥数银牌,这就是这周的AI大新闻。
Llama3.1 版本模型提供了更好的推理能力、更大的 128K token 上下文窗口,并改进了对8种语言的支持。
至顶网
数字生命卡兹克 2024-07-30 13:04:30
AI智能机器人如何学会团队合作:莫斯科科学家发明记忆共享技术让机器人告别"各自为政"
俄国科学家开发出共享记忆变换器(SRMT)技术,通过让机器人共享记忆而非直接通信来实现协作。该技术受人类大脑全局工作空间理论启发,让每个机器人都能访问共同的记忆池。在多项测试中,SRMT显著优于传统协作方法,特别是在稀疏奖励环境下表现突出,并展现出优异的泛化能力。该技术有望应用于物流仓库、自动驾驶、搜救等需要多智能体协调的实际场景。
至顶网
科技行者 2025-09-18 10:26:32
蒙特利尔理工大学重磅推出:让AI也能像人类一样"看懂"复杂表格的神奇数据集
蒙特利尔理工大学研究团队开发了Visual-TableQA数据集,通过多AI协作生成2500个复杂表格和6000个推理问答对,仅成本不到100美元。该数据集专门训练AI理解表格图像的视觉布局和复杂推理,实验显示微调后的模型在多个基准测试中超越专有模型,为AI视觉推理能力带来重大突破。
至顶网
科技行者 2025-09-26 13:55:11
谷歌DeepMind团队让Gemini 2.5学会"读懂"卫星多光谱图像:无需训练的零样本遥感革命
谷歌DeepMind团队创新性地让Gemini 2.5模型在无需训练的情况下学会理解卫星多光谱图像。他们将复杂的12波段卫星数据转换为6张可理解的伪彩色图像,配以详细文字说明,使通用AI模型能够准确分析遥感数据。在多个基准测试中超越现有模型,为遥感领域AI应用开辟了全新道路。
至顶网
科技行者 2025-10-13 15:14:26
疫情之下被互联网镌刻的共同记忆——“这漫长的宅家生活”
这些再平凡不过的故事,被互联网冠上了统一的社会记忆,一下子变得深邃而迷人。
至顶网
周雅 2020-02-14 09:43:34
从技术乌托邦到问题显微镜,AI for Good正在落到实处
他们的故事揭示了一个被低估的事实:AI向善的最好载体,或许就藏工业流水线、医疗手术台、田间农作物等真实世界场景的细枝末节里。
至顶网
周雅 2025-03-10 17:28:43
NVIDIA推出颠覆性研究工具:让任何人都能定制自己的AI研究助手
NVIDIA Research推出了革命性的UDR系统,让用户可以完全自定义AI研究助手的工作策略。该系统解决了传统研究工具固化、难以专业化定制的问题,支持任意语言模型,用户可用自然语言编写研究策略,系统自动转换为可执行代码。提供三种示例策略和直观界面,实现了AI工具的民主化定制,为专业研究和个人调研提供了前所未有的灵活性。
至顶网
科技行者 2025-09-19 11:08:03
上海AI实验室推出超级评委AI:让机器像人类专家一样评判文本质量
上海AI实验室推出CompassJudger-2,这是一个能够像人类专家一样评判文本质量的AI模型。通过创新的批判性思考训练方法和高质量数据处理,这个7B参数的模型在多个评估基准中超越了更大规模的竞争对手,展现出专业化训练的威力。
至顶网
科技行者 2025-07-22 09:23:26
800个书呆子(Nerd),如何在邮轮上办一场亚文化的趴体?
这是我跟“书呆子”们共度的一段旅程,这场游轮探险不只是对极客文化的致敬,更是对经典社会等级的彻底颠覆。
至顶网
海外来电 2022-12-11 16:24:48
<
上一页
616
617
618
619
620
621
622
623
624
625
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号