搜一下
用了 0.229254秒,为您找到
最好
买球
软件
網纸
YB233
相关内容17981 条
AI视觉系统告别"睁眼说瞎话":厦门大学团队发明TARS技术让机器准确描述图像内容
厦门大学团队开发的TARS技术通过创新的"最大-最小"博弈策略和频谱对齐方法,有效解决了AI视觉系统的幻觉问题。该技术仅用4800个训练样本就将描述错误率从26.4%降至13.2%,性能媲美GPT-4o,为医疗诊断、自动驾驶等关键领域提供了更可靠的AI视觉解决方案。
至顶网
科技行者 2025-08-06 11:14:04
从科幻到现实:复旦大学发布全球首个多模态统一奖励模型,让AI像人类评委一样判断图像和视频质量
复旦大学联合上海人工智能实验室发布的UnifiedReward是全球首个统一多模态奖励模型,能够同时评价图片和视频的生成与理解任务。该模型通过跨任务协同学习,在各项评测中都显著超越了专门的单任务模型,在图片理解任务上准确率提升近20个百分点。这项技术为AI评价体系带来革命性突破,将大大降低AI系统开发成本,提升各种视觉AI产品的整体质量。
至顶网
科技行者 2025-08-04 11:16:11
【报告】光力科技的以色列工厂:三次跨国并购如何为中国划片机企业筑起全球技术底座
今天讲的出海案例是光力科技,一家郑州起家的半导体切割设备制造商,通过分别收购英国 LP、英国 LPB 和以色列 ADT 三家企业,在十年内从零切入全球划片机赛道,目前已跻身全球前三。
至顶网
千流出海 2026-03-10 12:51:37
香港中大突破视频编辑难题:让你轻松掌控每一帧画面的神奇技术
这项来自香港中文大学的研究开发了名为"LoRA-Edit"的视频编辑技术,通过巧妙结合LoRA适应技术和遮罩机制,解决了传统视频编辑中编辑效果难以精确传播、背景容易被意外改变的问题。该技术让用户只需编辑第一帧画面,就能让编辑效果自然传播到整个视频,同时可通过参考图片进一步控制编辑外观,在多项对比测试中均超越现有先进方法。
至顶网
科技行者 2025-06-19 12:54:25
加州大学圣克鲁兹分校发布革命性图像编辑数据集:让开源AI模型首次逼近GPT-4o的专业水准
加州大学圣克鲁兹分校研究团队创建了包含150万高质量样本的GPT-IMAGE-EDIT-1.5M图像编辑数据集,通过利用GPT-4o优化现有数据质量,使开源AI模型在多项测试中达到接近GPT-4o的性能水平,在GEdit-EN测试中获得7.24分的突破性成绩,显著缩小了开源与商业模型的差距,为AI图像编辑技术的民主化奠定了基础。
至顶网
科技行者 2025-08-04 13:35:21
360 AI负责人梁志辉:AI搜索不是"缝合怪",2025是从游击队转向正规军的关键一年
AI刚出现的头两三年,大家都觉得AI会颠覆一切,可能需要用一些全新的标准来评价AI产品。但是经过一年多的发展,大家发现AI产品本质上还是产品,依然要用传统的产品指标来衡量,比如点击率、转化率、留存率等这些硬核指标。如果用户不喜欢你的产品,点击率自然就上不去;如果产品没有足够的黏性,日活跃用户(DAU)也就积累不起来。
至顶网
Super黄的念想 2025-01-14 11:04:06
小米研究院推出革命性GUI自动化框架:让AI像人一样"眨眼-思考-执行"操作界面
小米研究院推出的BTL-UI是一个革命性的GUI智能代理框架,通过模拟人类"眨眼-思考-执行"的认知过程,让AI能够像人类一样自然地操作各种应用界面。该技术在多个基准测试中实现了显著性能提升,为未来的人机交互和自动化应用奠定了重要基础。
至顶网
科技行者 2025-10-09 12:19:52
对话Rokid赵维奇:AR为什么是探索现实世界“副本”的最佳形态
作为中美连续创业者,赵维奇的创业之路非常宽泛,做过社交
软件
、做过游戏、做过面向极限运动的AR产品等。而现在,赵维奇作为Rokid全球开发者生态负责人,也参与负责Rokid多款软硬件产品设计与研发。他回忆说,最早加入Rokid是在实验室,开发Rokid第一代AR眼镜,相当于是一个小组在做内部创业的过程。
至顶网
周雅 2024-09-09 15:22:53
Kwai快手推出Keye-VL模型:让AI真正看懂短视频的突破性技术
快手推出的Keye-VL是一个专门为短视频理解而设计的80亿参数AI模型,在视频内容理解、数学推理和多模态任务方面达到同类模型中的最高水平。该模型采用独创的五模式推理系统和四阶段训练策略,能自动判断任务难度并选择合适的思考方式,在快手自建的KC-MMBench短视频基准测试中大幅领先其他模型。
至顶网
科技行者 2025-07-04 17:19:51
IBM THINK演讲实录 | IBM Services 高级副总裁Mark Foster: 以弹性应变 构建更强大的智慧企业
IBM Services 高级副总裁 Mark Foster 于IBM Think Digital 大会上的主题演讲全文。
至顶网
至顶网云计算频道 2020-05-12 14:37:36
谷歌DeepMind发布AlphaEvolve:会自己编程进化的AI智能体,破解56年未解数学难题
谷歌DeepMind发布AlphaEvolve:会自己编程进化的AI智能体,破解56年未解数学难题
至顶网
至顶AI实验室 2025-06-25 16:46:50
中国工业报2020“智造基石”优选榜揭晓,面向工业互联网、智能制造、数字化转型
经专家团队调研、企业申报、编辑推荐和评审组评定,中国工业报2020“智造基石”优选榜近日正式揭晓。
至顶网
业界供稿 2021-03-04 17:03:29
微软开发的14B参数AI:用510步训练就能媲美6710亿参数模型的数学推理能力
微软研究院开发的rStar2-Agent是一个仅140亿参数的AI数学推理模型,通过创新的智能体强化学习方法,在AIME24数学竞赛中达到80.6%准确率,超越了6710亿参数的DeepSeek-R1等大型模型。该模型的核心创新包括GRPO-RoC算法、分布式代码执行环境和渐进式训练策略,仅用510个训练步骤和一周时间就达到顶级性能,展示了"小模型大能力"的技术路径,为AI发展提供了高效替代方案。
至顶网
科技行者 2025-09-04 09:59:30
字节跳动推出FinSearchComp:让AI在金融搜索领域接受"真枪实弹"的考验
字节跳动联合哥伦比亚商学院推出首个开源金融搜索AI评测基准FinSearchComp,通过635个专业问题测试21个AI模型的金融数据搜索能力。研究发现最优AI模型在全球市场达到68.9%准确率,接近人类专家75%水平,但在复杂分析任务上仍存在显著差距,为AI在专业领域应用提供了重要的能力基准。
至顶网
科技行者 2025-10-13 08:57:42
天才程序员用AI重新定义虚拟世界创造:NetEase公司推出革命性游戏开发平台LatticeWorld
NetEase公司研究团队开发的LatticeWorld框架实现了虚拟世界生成的重大突破。该系统通过自然语言和草图输入,能够快速生成高质量的3D交互虚拟环境,效率比传统方法提升90倍以上。系统结合轻量级语言模型和工业级渲染引擎,支持动态角色交互和实时物理模拟,为游戏开发、教育培训等领域带来革命性变革。
至顶网
科技行者 2025-09-19 11:06:39
ByteDance Seed研究团队发布BAGEL:探索统一多模态预训练中的涌现能力
ByteDance Seed团队发布的BAGEL是一个突破性开源基础模型,采用混合变换器专家架构,能同时执行多模态理解和生成任务。研究显示,随着训练数据和模型规模增加,BAGEL展现"涌现能力"—从基础理解和生成,到复杂编辑和自由形式视觉操作,再到长上下文推理,呈现能力阶梯式提升。模型在标准基准测试中超越现有开源统一模型,并显示出强大的世界建模能力,如世界导航和视频生成。研究团队开源了代码和模型检查点,为多模态AI研究开辟新方向。
至顶网
科技行者 2025-05-26 08:20:53
马塞诸塞大学发现:AI助手正在网上"大嘴巴",你的隐私信息可能已经泄露了
这项研究系统揭示了AI网络助手存在的严重隐私泄露问题,发现AI助手不仅通过文字还会通过行为泄露用户信息,且行为泄露的严重程度是文字泄露的5倍。研究提出SPILLAGE框架用于检测四种不同类型的隐私泄露,并发现移除无关个人信息实际上能提升AI助手17.9%的任务成功率,证明了隐私保护与功能效果可以相互促进。
至顶网
科技行者 2026-02-26 14:59:07
清华大学团队创新AI工具:让机器人学会主动"忘记"无关信息,像人类一样聪明思考
清华大学团队开发了Sculptor认知管理框架,解决AI处理长文本时的"主动干扰"问题。通过信息分解、动态隐藏、智能搜索等工具,让AI学会主动管理工作记忆,像人类一样筛选重要信息。实验显示在复杂推理任务中性能显著提升,为AI认知智能发展开辟新方向。
至顶网
科技行者 2025-08-11 11:03:59
华为团队重大突破:让AI直接理解数学题并给出严格证明,就像有了一个永不出错的数学助手
华为诺亚方舟实验室联合香港中文大学团队在2025年6月首次实现了从自然语言数学问题到严格证明的端到端自动化处理。他们开发的Mathesis系统包含创新的强化学习自动形式化器、精细化评估框架LeanScorer,以及高性能证明器,在中国高考数学测试集上达到18%成功率,相比最佳基线提升22%。该系统已集成到华为Celia智能助手中,将数学问题解决准确率从65.3%提升至84.2%,展现了AI数学推理的巨大应用潜力。
至顶网
科技行者 2025-06-16 09:57:21
爱丁堡大学团队揭秘:让AI更精准聚焦的"光谱注意力导航术"
这项由爱丁堡大学联合多家机构开展的研究,提出了SEKA注意力引导新技术,解决了AI系统无法准确关注用户标记重点信息的问题。该技术通过在计算前调整输入向量而非事后修改,实现了与现代计算框架的完美兼容,效率提升显著,在多项测试中表现优异,为下一代智能AI系统奠定了基础。
至顶网
科技行者 2026-03-04 15:08:51
<
上一页
891
892
893
894
895
896
897
898
899
900
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号