用了 0.106070秒,为您找到bob 什么 意思 網纸 YB233相关内容9785 条
  • REARANK:基于强化学习的推理重排序智能助手——助力文献搜索更智能更精准

    这项研究介绍了REARANK,一种基于大语言模型的创新列表式推理重排序助手。通过强化学习技术,该模型在排序前先进行明确推理,显著提升了排序性能和可解释性。仅使用179个标注样本训练的REARANK-7B在多个信息检索基准测试中表现卓越,甚至在推理密集型任务上超越了GPT-4。研究证明了结合推理能力与高效排序策略的重要性,为构建更智能的信息检索系统提供了新思路。
    至顶网  科技行者  2025-05-30 14:39:47  
  • FLUX图像生成模型的新突破:腾讯等机构联合解决AI奖励欺骗问题的创新方案

    腾讯混元等机构联合提出PREF-GRPO方法,首次采用成对偏好比较替代传统评分,成功解决AI图像生成中的奖励欺骗问题。同时构建UNIGENBENCH评测基准,包含600测试案例和27个细粒度评价维度,为行业提供更精确的模型评估标准。实验显示新方法在多项指标上显著优于传统方法,特别在复杂任务上提升明显。
    至顶网  科技行者  2025-09-04 14:32:47  
  • AI预测师挑战超级人类:谁能更准确地预测未来?——乔治梅森大学实证研究揭秘

    乔治梅森大学研究发现,最新AI模型在预测准确性上首次超越普通人群,但仍显著落后于人类顶级预测专家。通过464个真实预测问题的测试,OpenAI的o3模型表现最佳,但"超级预测师"的表现仍是AI的六倍。研究揭示AI在政治预测上表现较好,但在经济问题上相对较弱,同时存在过度自信的问题。
    至顶网  科技行者  2025-07-11 09:52:38  
  • 看电影学音频高亮:让你的视频声音更符合画面重点

    近年来,视频内容创作与消费显著增长,而协调视听元素对于打造优质内容至关重要。罗切斯特大学的Chao Huang及合作者开发了视觉引导的声音高亮(visually-guided acoustic highlighting)技术,解决了视觉与声音不协调的常见问题。研究团队洞察到电影中的精心制作音频可作为"免费监督信号",创建了THE MUDDY MIX DATASET数据集,并设计了基于Transformer的VisAH模型,在所有评估指标上显著超越基线方法,实现了更加和谐的视听体验。
    至顶网  科技行者  2025-05-27 09:40:44  
  • Tiny QA Benchmark++:LLMOps持续评估的轻量级多语言基准测试套件

    Tiny QA Benchmark++(TQB++)是一个超轻量级的大型语言模型(LLM)评估工具,由Comet ML公司的Vincent Koc开发。这套工具仅需几秒钟即可检测LLM系统中的关键故障,与大型基准测试形成鲜明对比。其核心是一个不到20KB的52个精心制作的英语问答集,非常适合快速CI/CD检查和提示工程。TQB++的主要创新在于提供了一个合成数据生成工具包,能够按需产生任何语言、领域或难度的微型基准测试,并预先构建了11种语言的测试包。
    至顶网  科技行者  2025-05-23 07:40:18  
  • AI 医疗:当智慧与机器相遇

    人工智能在健康领域正迎来重要时刻。从能够将医疗指南翻译成地方语言的聊天机器人,到能在几秒钟内检测贫血的手机应用,再到减少疾病诊断错误的数字显微镜,新的人工智能驱动解决方案似乎每天都在推出。然而,单纯的技术“惊艳”只讲述了部分故事。当人工智能与人类的同理心、文化理解和理想价值观相结合时,它才真正具有变革性。这种合成被称为混合智能,确保技术能够满足真实需求,而不是追求新奇。
    至顶网  Forbes  2025-03-06 16:47:34  
  • 亚马逊云科技助力涂鸦智能出海,家庭能源管理系统(HEMS)将成智能家居新沃土

    今年6月,《财富》(中文版)发布“2023年值得关注的中国出海主力”盘点,在七个赛道中聚焦不断开拓新领域、影响力与日俱增的出海企业。
    至顶网  业界供稿  2023-08-10 12:18:49  
  • 蒙特利尔理工大学重磅推出:让AI也能像人类一样"看懂"复杂表格的神奇数据集

    蒙特利尔理工大学研究团队开发了Visual-TableQA数据集,通过多AI协作生成2500个复杂表格和6000个推理问答对,仅成本不到100美元。该数据集专门训练AI理解表格图像的视觉布局和复杂推理,实验显示微调后的模型在多个基准测试中超越专有模型,为AI视觉推理能力带来重大突破。
    至顶网  科技行者  2025-09-26 13:55:11  
  • 一文读懂 LLM 的构建模块:向量、令牌和嵌入

    本文讨论了构建大型语言模型(LLM)的关键要素:向量、令牌和嵌入。向量是机器理解语言的基础,通过将文本数据转换为高维向量空间中的表示。令牌是文本数据在模型内部的表示形式,可以是单词、子词或字符。嵌入则是融入了语义语境的令牌表征,代表文本的意义和上下文信息。这些组件共同构筑了LLM的技术支柱,赋予模型卓越的语言理解和生成能力。
    至顶网  架构驿站  2024-04-24 23:04:21  
  • ByteDance智能创作实验室与清华大学联手:让任何人都能制作电影级说话视频

    ByteDance智能创作实验室与清华大学联合发布HuMo系统,这是首个实现文字、图片、音频三模态协同控制的人物视频生成框架。该系统通过创新的渐进式训练方法和时间自适应引导策略,让用户仅需提供文字描述、参考照片和音频就能生成电影级说话视频,在多项评测中超越现有专业系统,为内容创作带来革命性突破。
    至顶网  科技行者  2025-09-12 16:50:07  
  • AI绘画界的"反作弊神器":清华大学团队推出T-LoRA技术,让AI不再"背答案"

    清华大学团队推出T-LoRA技术,解决AI绘画中的"背答案"问题。该技术通过时间步骤的智能控制和正交初始化,让AI在学习单张照片时既保持特征准确性,又避免过度记忆背景等细节,生成更有创意和多样性的图像。实验显示T-LoRA在文本对齐度方面比传统方法提升约10%,为AI创意产业开辟新可能性。
    至顶网  科技行者  2025-07-21 09:12:37  
  • 英伟达继续高歌猛进,AMD与英特尔的AI计划恐难招架

    对于过去几代产品而言,两年一更新的速度足以保持竞争优势。但根据本月早些时候投资者们看到的演示文稿,英伟达手中除了B100这张王牌,还有将Arm核心与Blackwell架构匹配打造的全新“超级芯片”,外加L40及L40S的迭代产品。
    至顶网  至顶网计算频道  2023-10-16 09:09:09  
  • 跨越语言与文化的鸿沟:VideoVista-CulturalLingo视频理解评测基准的突破性研究

    想象一下,你有一位智能助手,它能够理解各种视频内容并回答你的问题。你给它看一段关于中国传统节日的视频,问它"这个节日人们通常会吃什么食物?"。如果这个助手主要是"看过"西方文化背景的视频,它很可能会对中国文化相关的问题感到困惑。
    至顶网  科技行者  2025-04-29 12:24:58  
  • 企业中的 9 大生成式 AI 应用场景

    生成式 AI 正在各行各业广泛应用。从客户服务到药物研发,从营销支持到网络安全,生成式 AI 正在改变企业的运营方式。它不仅可以提高效率,还能开启创新机遇。虽然目前应用场景有限,但随着技术进步和用户创意,未来将会涌现更多应用。企业需要审慎评估投资回报,选择合适的应用场景,以充分发挥生成式 AI 的潜力。
    至顶网  CIO.com  2025-01-08 10:10:00  
  • 高通Fabian Gonell:全球化标准与知识产权合作加快创新步伐

    在主旨发言环节,高通公司(Qualcomm)许可策略高级副总裁、法律顾问Fabian Gonell(费比安·戈内尔)发表了题为“全球化标准体系和知识产权合作造福世界”的主旨发言。
    至顶网  科技行者  2023-07-10 19:05:53  
  • 众生万相,终归本源 青藤云安全发布青藤万相·主机自适应安全平台

    9月14日,青藤云安全2018年战略与新品发布会在京成功举办,并宣布正式推出青藤万相·主机自适应安全平台。
    至顶网  业界供稿  2018-09-14 17:42:32  
  • AI与野火的交锋:捍卫居民生命与财产安全

    加州居民,大家对每年的野火季可谓心有余悸。过去五年来,4到10月“如期而至”的野火总会疯狂吞噬公共土地和私人财产,造成数千亿美元的损失和生命逝去的悲剧。
    至顶网  至顶网软件与服务频道  2023-03-22 14:11:19  
  • 我们应该如何记忆这场瘟疫?

    瘟疫正离我们很近,但在多数时光里,瘟疫又离我们很远。
    至顶网  高飞  2020-02-14 10:57:31  
  • Kyligence 用户大会演讲实录:以 AI 变革组织运营与管理

    7月14日,以“释放数智生产力”为主题的 Kyligence 用户大会在上海前滩香格里拉大酒店成功举行。
    至顶网  至顶网大数据频道  2023-07-18 10:27:38  
  • 谷歌DeepMind团队让Gemini 2.5学会"读懂"卫星多光谱图像:无需训练的零样本遥感革命

    谷歌DeepMind团队创新性地让Gemini 2.5模型在无需训练的情况下学会理解卫星多光谱图像。他们将复杂的12波段卫星数据转换为6张可理解的伪彩色图像,配以详细文字说明,使通用AI模型能够准确分析遥感数据。在多个基准测试中超越现有模型,为遥感领域AI应用开辟了全新道路。
    至顶网  科技行者  2025-10-13 15:14:26  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号