用了 0.100278秒,为您找到奔驰 宝马 游戏 网站 bcbm 網纸 YB233相关内容6792 条
  • 让手机变得更聪明:大型语言模型在手机自动化领域的惊人进展

    想象一下,你只需对手机说一句"帮我订一杯拿铁送到办公室",手机就能自动打开外卖应用,找到你喜欢的咖啡店,选择拿铁,填写地址,完成支付,一气呵成地完成所有操作。这不是科幻电影中的场景,而是当前大型语言模型驱动的手机图形界面(GUI)代理正在实现的功能。
    至顶网  科技行者  2025-04-30 13:41:43  
  • FinTagging: 金融信息提取与结构化的新基准测试,让大语言模型更懂财报数据

    这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
    至顶网  科技行者  2025-06-01 18:58:21  
  • 俄勒冈大学研究团队推出mSCoRe:让AI学会全球常识推理的"多语言考场"

    俄勒冈大学和Adobe研究团队开发了mSCoRe基准系统,专门测评AI在多语言环境下的常识推理能力。该系统首次将推理过程细分为十种基本技能,涵盖逻辑、情境和社会伦理三大类别,并创新性地引入动态复杂度扩展机制。通过对八个顶级大语言模型的全面测试,研究发现现有AI系统过度依赖单一推理模式,在文化敏感的社会常识判断上仍有显著不足。
    至顶网  科技行者  2025-09-09 10:12:38  
  • USC团队重新定义视觉生成:一种让AI更容易"理解"图片的神奇方法

    USC研究团队提出的潜在去噪分词器(l-DeTok)通过在训练过程中引入插值噪声和随机遮罩,让视觉分词器学会从损坏信息中重建图像,使其更好地适配下游生成模型的去噪任务。该方法在六种代表性生成模型上均实现显著性能提升,为视觉分词器设计提供了全新思路。
    至顶网  科技行者  2025-07-25 09:36:35  
  • MiniMax-M1:让AI推理不再昂贵的革命性突破

    MiniMax公司发布了世界首个开源大规模混合注意力推理模型MiniMax-M1,通过创新的"闪电注意力"机制将AI推理的计算复杂度从平方级降低到线性级,支持100万词汇上下文和8万词汇生成长度。该模型在保持强大性能的同时,将长文本处理的计算成本降低75%,仅用53万美元就完成了完整训练,在软件工程、长文档理解等复杂场景中表现优异,为AI推理技术的普及奠定了重要基础。
    至顶网  科技行者  2025-06-20 10:27:52  
  • 视觉语言模型也能深度思考:香港科技大学推出VL-Rethinker,让AI看图答题像人类一样反思纠错

    香港科技大学研究团队推出VL-Rethinker,这是首个能在视觉语言任务中进行深度反思的AI系统。通过创新的"选择性样本回放"和"强制反思"训练策略,VL-Rethinker在数学视觉推理等任务上显著超越GPT-o1,证明了AI可以学会像人类一样自我检查和纠错,为构建更智能可靠的多模态AI系统开辟了新路径。
    至顶网  科技行者  2025-07-15 09:58:45  
  • CapSpeech:开创风格提示语音合成的下游应用新纪元

    CapSpeech是约翰·霍普金斯大学等机构联合提出的风格描述文本转语音合成基准,包含超过1000万机器标注和36万人工标注的语音-描述配对。它支持五大下游任务:基础风格描述、带音效的语音合成、口音控制、情感表达和表现力丰富的虚拟代理。研究团队开发了自回归和非自回归两种模型,并通过客观和主观评估证明了该基准的有效性。CapSpeech不仅丰富了语音合成的表现力和可控性,还为实际应用如有声读物、对话代理和跨文化语音合成铺平了道路。
    至顶网  科技行者  2025-06-09 10:35:27  
  • 布朗大学与Adobe联手推出UI视频教程"智能导师",让软件学习像看电影一样轻松

    布朗大学与Adobe研究院联合推出MS4UI数据集,专门解决软件教学视频的智能总结问题。该研究收集了2413个Adobe软件教程视频,提出视频分割、文本总结、视频总结三大任务,为软件学习AI开辟新方向。实验显示现有方法表现不佳,凸显了专业领域AI的技术挑战。
    至顶网  科技行者  2025-06-20 09:30:12  
  • 服务器保卫战:它在网络空间里坚守最后一道防线

    网络安全的保卫者们要随时做好准备,同入侵者在每一台服务器甚至每一个进程里展开“巷战”,并将他们彻底消灭。
    至顶网  至顶网网络与安全频道  2021-03-30 10:19:04  
  • 她被称为互联网第一夫人,她是JPEG“代言人”,她叫Lena

    每个做过计算机图像处理的人,都认识 Lena Forsen。
    至顶网  科技行者  2019-02-18 13:00:46  
  • AI服务器产业链及竞争格局分析

    Open AI的大型语言生成模型ChatGPT火热,它能胜任刷高情商对话、生成代码、构思剧本和小说等多个场景,将人机对话推向新的高度。全球各大科技企业都在积极拥抱AIGC,不断推出相关技术、平台和应用。
    至顶网  架构师技术联盟  2024-04-16 01:04:20  
  • 5G经济已来,产业创新没有“隐秘的角落”

    我们正在目睹,以5G为代表的新一代信息技术,就在赋予社会这种经济韧性。
    至顶网  周雅  2020-07-10 11:54:39  
  • OpenAI重大突破:让AI自己做研究,从读论文到写代码全包了

    OpenAI团队开发了PaperBench评估系统,测试AI复现顶级机器学习论文的能力。通过20篇ICML 2024精选论文和8316个评估点,发现最强AI模型Claude 3.5 Sonnet达到21%成功率,而人类专家为41.4%。研究揭示AI在代码编写方面较强但在实际执行中存在局限,为AI科研能力发展提供重要基准。
    至顶网  科技行者  2025-07-14 09:47:35  
  • Alita:极简设计打造无限创造力的通用AI助手

    Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。
    至顶网  科技行者  2025-06-01 11:15:55  
  • 高通巴展宣告5G元年:“万物互联”通向新世界,限制我们的只有想象力

    5G毫无疑问是今年巴展的焦点,作为 5G 产业链中的重要一环,高通成为存在感最高的参展商,阿蒙则成为最忙的人。
    至顶网  周雅  2019-03-08 16:46:26  
  • 哈佛大学首次实现"时间流动"感知的人工智能:让机器像人类一样理解运动和变化

    哈佛大学研究团队首次实现了人工智能的"流等变性",让机器能够像人类一样理解时间中的运动和变化。这项突破性研究开发出FERNNs神经网络,不仅能识别物体位置,还能理解运动规律。实验显示,该技术在运动预测任务中性能提升50倍,并具备零样本泛化到新运动模式的能力,为自动驾驶、机器人、视频分析等领域开辟了新前景。
    至顶网  科技行者  2025-08-06 11:09:20  
  • 日本《人工智能运营商指南(草案)》解读

    日本发布《人工智能运营商指南(草案)》,旨在应对生成式人工智能技术变化,提供统一的人工智能治理指导原则。草案分为五部分,包括人工智能定义、社会愿景、行为准则,以及针对人工智能研发者、提供者、业务用户的具体规范。
    至顶网  清华大学智能法治研究院  2024-03-03 14:04:36  
  • 南洋理工大学团队革命性突破:让AI绘画像艺术家一样从粗到细,一步步创作精美图像

    南洋理工大学研究团队开发的NVG技术革新了AI图像生成方式,让AI学会像画家一样分层创作。该技术将图像分解为9个粒度层次,从整体构图到精细细节逐步生成,不仅提高了图像质量,还提供了前所未有的结构控制能力。在多项评测中NVG均优于现有方法,仅需9步即可生成高质量图像,为数字艺术创作和AI可控生成开辟了新路径。
    至顶网  科技行者  2025-08-27 10:00:48  
  • 全球首次实现:让任何人的电脑都能参与训练超大AI模型——Prime Intellect团队的分布式强化学习突破

    Prime Intellect团队首次实现320亿参数AI模型的全球分布式强化学习训练,开发了INTELLECT-2推理模型。该研究突破了传统中心化训练的限制,通过PRIME-RL框架、SHARDCAST权重分发和TOPLOC验证系统,让全球任何拥有GPU的计算机都能参与大模型训练,显著降低了AI开发门槛,为AI民主化发展开辟了新路径。
    至顶网  科技行者  2025-07-09 11:49:16  
  • 微软年度开发者大会线上开幕——Azure超级计算机、负责任的机器学习助力开发者创造未来

    5月19日,微软年度开发者大会Build 2020以完全数字化的形式在线上开幕。48小时内,微软通过一系列在线直播和互动环节,向来自全球的软件及移动应用开发者、数据科学家、IT专家社区展示其围绕开发者、智能云、生产力、协作工具等推出的一系列最新举措和成果。
    至顶网  业界供稿  2020-05-20 10:24:45  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号