用了 0.296995秒,为您找到mg 娱乐 公司 什么 網纸 YB233相关内容26188 条
  • Tiny QA Benchmark++:LLMOps持续评估的轻量级多语言基准测试套件

    Tiny QA Benchmark++(TQB++)是一个超轻量级的大型语言模型(LLM)评估工具,由Comet ML公司的Vincent Koc开发。这套工具仅需几秒钟即可检测LLM系统中的关键故障,与大型基准测试形成鲜明对比。其核心是一个不到20KB的52个精心制作的英语问答集,非常适合快速CI/CD检查和提示工程。TQB++的主要创新在于提供了一个合成数据生成工具包,能够按需产生任何语言、领域或难度的微型基准测试,并预先构建了11种语言的测试包。
    至顶网  科技行者  2025-05-23 07:40:18  
  • 谷歌凭借强大的新型芯片 迎接量子计算时代

    最新的发展成果来自谷歌公司,其于本周一推出了首款72量子位量子处理器,这也是迄今为止出现的计算能力最强的量子处理器。而亚军头衔则由IBM公司于去年制造的50量子位芯片所持有。
    至顶网  siliconANGLE  2018-03-07 10:57:14  
  • Google推出 Gemini iPad 应用

    Google 正在扩展 Gemini AI 的应用体验,推出专为 iPad 设计的 Gemini 应用。该应用支持原生 Apple 硬件和分屏模式,让用户可同时使用 Gemini 助手与其他应用,目前在所有支持 Gemini 的地区均可于 App Store 下载,更多功能或将于 Google I/O 2025 推出。
    至顶网  engadget  2025-05-16 11:03:38  
  • 大型语言模型能力测试大揭秘:中科院团队发布283个评测基准全景分析

    中科院深圳先进技术研究院团队首次全面梳理了大型语言模型评测领域,分析了283个代表性基准,将其归纳为通用能力、领域专业和特定目标三大类别。研究揭示了现有评测体系面临的数据污染、文化偏见和静态评测等关键挑战,为构建更科学公正的AI评测框架提供了重要指导,推动人工智能技术向更安全可靠的方向发展。
    至顶网  科技行者  2025-10-11 09:53:47  
  • 大型机市场的商业游戏:IBM公司收购T-Systems部分资产

    根据多个消息来源,IBM公司即将收购德国电信旗下表现不佳的大型机业务部门。
    至顶网  The Register  2019-01-16 12:59:51  
  • 摩根士丹利开放源码:Q语言编程新突破,让AI掌握金融界专用代码语言

    摩根士丹利研究团队开发了专门掌握Q编程语言的AI模型QQwen,通过创新的三阶段训练方法(预训练、监督学习、强化学习),让开源AI模型在Q语言编程测试中达到59%准确率,超越GPT-4.1等商业模型。研究团队完全开源了模型、数据和训练代码,为AI专业化训练提供了可复制的成功范式,证明了中等规模开源模型通过针对性训练可以在特定领域超越大型商业模型的表现。
    至顶网  科技行者  2025-08-15 09:06:51  
  • 蒙特利尔理工大学重磅推出:让AI也能像人类一样"看懂"复杂表格的神奇数据集

    蒙特利尔理工大学研究团队开发了Visual-TableQA数据集,通过多AI协作生成2500个复杂表格和6000个推理问答对,仅成本不到100美元。该数据集专门训练AI理解表格图像的视觉布局和复杂推理,实验显示微调后的模型在多个基准测试中超越专有模型,为AI视觉推理能力带来重大突破。
    至顶网  科技行者  2025-09-26 13:55:11  
  • Victoria’s Secret 遭遇服务中断,正应对安全事件

    时尚零售巨头维多利亚的秘密因安全事件导致网站和线上订单服务中断,已立即启动应急响应、邀请第三方专家协助恢复运营,实体店仍正常营业。
    至顶网  Techcrunch  2025-06-05 17:53:53  
  • 微软收购对话式AI公司Semantic Machines

    微软公司副总裁、人工智能与研究首席技术官David Ku在一篇博客文章中宣布,微软收购位于美国加州伯克利的会话人工智能公司Semantic Machines。Semantic Machines开发的自然语言处理技术将被整合到微软产品中,如Cortana和Azure Bot Service。
    至顶网  Forbes  2018-05-22 18:14:32  
  • Oracle收购销售情报初创公司DataFox 将与云产品集成

    Oracle本周一晚间宣布计划收购位于旧金山的初创公司DataFox,该公司致力于为B2B企业提供销售情报。
    至顶网  siliconANGLE  2018-10-25 11:02:21  
  • AWS出海加速营正式启动

    亚马逊通技术服务(北京)有限公司在AWS创业者之日*北京站活动上宣布,AWS出海加速营项目正式启动。该项目旨在利用包括亚马逊电商、Amazon Web Services、Amazon Echo、Amazon Alexa Fund及第三方的资源,助力中国创业公司拓展海外市场。
    至顶网  至顶网CIO与应用频道  2019-05-20 09:03:38  
  • 华为拒绝“孤立主义”

    面对制裁,“补洞”只是一时之举,解决全人类面对的未知问题,才是华为在无人区的奋斗之本。
    至顶网  周雅  2020-05-21 09:34:04  
  • 零零信安:攻击面管理(ASM)技术详解和实现

    攻击面管理(Attack Surface Management)的概念已经存在三年以上了,但是在过去的一年(2021年),整个安全行业突然迅速接纳了它。
    至顶网  业界供稿  2022-03-17 15:59:51  
  • 同样是语音沟通,为什么有人宁愿发语音信息也不打电话?

    打电话?不行!语音信息?行!
    至顶网  Vox  2023-04-07 12:09:51  
  • 复旦大学团队突破多模态AI理解瓶颈:让机器像人一样"看懂"图片不再靠猜测

    复旦大学等机构联合提出ASVR方法,通过自回归语义视觉重构解决大型视觉语言模型过度依赖文字监督的问题。该方法让AI同时学习视觉和文本信息,在14个多模态理解基准上平均提升5个百分点。研究发现语义重构比像素重构更有效,且方法在不同架构、数据规模和分辨率下均表现稳健,为AI视觉理解能力提供了新的技术路径。
    至顶网  科技行者  2025-06-16 10:57:34  
  • 英特尔与中国移动咪咕公司签署技术商务合作备忘录,共同推动内容与科技融合创新

    今日,在以“开放引领发展,合作共赢未来”为主题的2023中国国际服务贸易交易会上,英特尔与中国移动咪咕公司宣布签署技术商务合作备忘录。
    至顶网  业界供稿  2023-09-02 20:55:49  
  • 数字孪生正在改变航空公司的运营思维

    数字孪生技术已经彻底改变了航空产业。
    至顶网  至顶网软件与服务频道  2024-03-04 15:54:33  
  • 视频技能思维链:用领域自适应的技能链实现视频推理突破

    这项研究提出了VIDEO-SKILL-COT(别名VIDEO-SKOT),一种新型视频理解框架,能自动构建和利用技能感知的思维链进行领域自适应视频推理。北卡罗来纳大学教堂山分校的研究人员首先从训练问题中提取领域相关推理技能并聚类成共享技能分类法,然后为每个视频-问题对创建定制的多步骤思维链。接着,他们开发了技能专家学习框架,每个专家模块专注于特定推理技能集。在三个不同的视频理解基准测试上,该方法一致优于现有系统,显示了其出色的领域适应能力。
    至顶网  科技行者  2025-06-09 07:24:00  
  • 上海人工智能实验室开发VRBench:首个专门评估AI看长视频推理能力的测试平台

    这项由上海人工智能实验室、南京大学和中科院深圳先进技术研究院联合完成的研究,开发了全球首个专门测试AI长视频推理能力的评估平台VRBench。该平台包含1010个多语言长视频和超过9000个多步推理问答对,创新性地采用双重评估机制,既测试AI的答案准确性,也评估推理过程质量。测试结果显示,即使是最先进的AI模型在复杂视频推理任务上仍存在显著不足,特别是推理过程的可靠性方面。
    至顶网  科技行者  2025-06-17 14:36:41  
  • 斑马技术任命于放为大中华区业务总负责人

    作为致力于助力企业实现数据、资产和人员智能互联的先进数字解决方案提供商,斑马技术公司已任命于放先生为大中华区业务总负责人,管理并发展该区域的整体业务。于放先生向斑马技术亚太区高级副总裁兼总经理吴辉明先生汇报。
    至顶网  至顶网软件与服务频道  2024-03-05 16:43:44  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号