用了 0.196148秒,为您找到mg 娱乐 公司 什么 網纸 YB233相关内容20327 条
  • 从看图说话到看视频聊天:Salesforce带来史上最强多模态理解新突破

    本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准,首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线,展示了从专门化向通用化发展的重要趋势,为多媒体内容理解、智能搜索和人机交互带来突破性进展。
    至顶网  科技行者  2025-07-11 09:52:55  
  • 音乐AI的大考验:伦敦玛丽女王大学开发全新评测体系,揭示当前音乐智能模型的真实水平

    伦敦玛丽女王大学研究团队开发了CMI-Bench音乐AI评测基准,首次对11个主流音乐AI模型进行全面测试。结果显示这些模型在标准化评测中表现远低于预期,普遍不如传统专业软件,还存在明显文化偏见和性别偏见,为音乐AI发展提供了重要警示。
    至顶网  科技行者  2025-06-24 13:48:51  
  • 让AI"眼睛"更干净:印第安纳大学团队为视觉语言模型清理"有毒"训练数据

    这项研究首次系统性地检测和清理了视觉语言模型训练数据中的有害内容,从LLaVA数据集的558,000对图片-文字数据中识别并移除了7,531个有毒样本。研究团队开发了结合图像和文本检测的多模态毒性过滤系统,为AI安全建立了新标准,并开源了清理后的数据集供学术界使用。
    至顶网  科技行者  2025-07-10 09:33:02  
  • 世界模型的全新架构:卡内基梅隆大学团队提出PAN模型,让AI拥有"大脑中的虚拟世界"

    卡内基梅隆大学研究团队深入分析了当前世界模型的根本缺陷,提出了PAN架构。该研究发现现有系统过分关注视觉效果而忽略智能推理,提出混合表示和多尺度推理的解决方案。PAN采用离散标记和连续嵌入的组合,通过增强的大语言模型和扩散预测器实现真正的"思想实验"能力,为AI从内容生成器向智能推理系统的转变提供了新路径。
    至顶网  科技行者  2025-07-18 09:35:00  
  • 没有标准化的未来:Meta推出DyT技术颠覆Transformer架构设计思维

    Meta研究团队提出DyT技术,用极简的动态双曲正切函数替代传统标准化层,在视觉、语言、语音等多领域测试中均达到或超越原有性能。这项研究挑战了标准化层不可或缺的传统观念,证明简单直接的方法有时比复杂方案更有效,为神经网络架构设计开辟了新思路。
    至顶网  科技行者  2025-08-04 13:32:33  
  • 创新技术与业务场景融合,星环科技大数据智能化、多模态、平民化

    5月26日,“向星力·未来数据技术峰会(FDTC)”在上海成功举办。星环科技创始人、CEO孙元浩表示,未来人人都是数据科学家,人类与数据的交互方式将发生重大变革,语言、视频等自然语言的交互方式将逐渐普及,每个人都将需要一个“虚拟业务助手”。
    至顶网  业界供稿  2023-05-26 15:34:42  
  • R3:打破传统,创建超强"裁判型"人工智能——斯坦福大学等机构联合研究突破性奖励模型

    这项由斯坦福大学和多家研究机构联合推出的R3(强健的无评分标准奖励模型)系统,解决了现有AI评估模型在可控性与可解释性方面的关键缺陷。不同于仅提供分数的传统模型,R3能适应任何评分标准,支持单项评分、对比评分和二元评分三种评估形式,并提供详细解释。研究团队从45个来源构建了高质量数据集,即使仅用14,000个训练样本,R3模型也在众多基准测试中超越了现有系统。这一突破性研究为AI系统提供了更透明、更可信的评估方式,有望显著改善人类与AI的互动体验。
    至顶网  科技行者  2025-05-23 15:27:36  
  • 解锁区块链智能

    区块链如何为人工智能解锁新的领域?
    至顶网  科技行者  2018-06-15 11:28:04  
  • 技术界的新突破:以色列理工学院研究团队让AI模型学会"思维延续"的神奇技能

    以色列理工学院研究团队开发出一种新颖的AI推理改进方法,通过训练专用的"继续思考"标记,让AI模型在解题时能够进行更深入的思考。该方法只需训练单个标记的嵌入向量,保持模型其他参数不变,在数学推理任务中展现出显著效果,准确率提升幅度达到传统方法的三倍以上,为AI推理能力提升提供了高效且通用的解决方案。
    至顶网  科技行者  2025-06-19 12:54:40  
  • 斯坦福大学等多校联手:首个多语言视觉检索基准VisR-Bench,让AI真正"看懂"全球文档

    斯坦福大学等研究机构联合发布首个多语言视觉检索基准VisR-Bench,系统评估AI在16种语言、1286份真实文档上的检索能力。研究发现现有AI系统在表格理解和低资源语言处理方面存在显著局限,最先进模型准确率仅75%,阿拉伯语等语言表现更差。该基准为改进多语言文档AI提供重要参考。
    至顶网  科技行者  2025-08-14 10:27:49  
  • GPTailor:让大模型"瘦身"不再难!马克斯·普朗克研究所推出革命性AI模型压缩技术

    马克斯·普朗克研究所推出GPTailor技术,通过多模型智能融合实现大语言模型25%参数削减的同时保持97%性能,为AI模型高效部署提供新思路。该方法将模型压缩从单一模型"减法"转变为多专业模型"重组融合",在14项基准测试中显著优于传统压缩方法。
    至顶网  科技行者  2025-07-01 09:54:07  
  • NVIDIA发布Nemotron Nano 2:小身材大智慧,让AI推理速度飞跃6倍

    NVIDIA发布Nemotron Nano 2混合AI模型,采用创新的Mamba-Transformer架构,在保持90亿参数规模的同时,实现了比同类模型3-6倍的推理速度提升。该模型在数学、科学、编程等复杂推理任务上表现出色,支持15种语言,能在单GPU上处理12.8万字符长文本,为高效AI应用开辟了新路径。
    至顶网  科技行者  2025-09-09 10:35:07  
  • NVIDIA与CMU联合开发:让AI像写文章一样理解视频,一个模型搞定所有视频任务

    NVIDIA联合CMU等机构开发了AUSM通用视频分割模型,首次将语言模型思路引入视频理解,用一个模型统一处理各种视频任务。该模型采用创新的并行训练策略,训练速度提升2.5倍,在七个权威数据集上均达到领先水平。AUSM突破了传统方法需要针对不同任务训练专门模型的限制,为视频AI应用提供了更简洁高效的解决方案。
    至顶网  科技行者  2025-09-02 16:02:19  
  • MIT和Jina AI团队联手打造:小身材大能量的代码搜索新利器

    MIT和Jina AI联合开发的jina-code-embeddings代码嵌入模型,通过改造预训练代码生成模型实现高效代码检索。该模型支持自然语言查询代码、技术问答和跨语言代码搜索,尽管参数规模较小(0.5B-1.5B),但在25项基准测试中表现优异,为AI辅助编程和智能开发环境提供了高性价比的基础工具。
    至顶网  科技行者  2025-09-05 11:26:15  
  • 重塑边界,开启财务共享+时代

    数字化时代,你心目中的财务共享中心是什么样的?财务核算中心?标准化流程中心?实现集中办公?如果您对财务共享的印象仅止于此——那么,恭喜你!你OUT了!
    至顶网  元年科技  2021-10-27 17:41:51  
  • Unbabel团队突破性成果:如何让AI既能精通翻译又不失聊天本色?

    Unbabel团队开发的TOWER+模型系列实现了翻译专业性与通用AI能力的完美平衡。通过创新的四步训练方法,即使2B参数的小模型也能在翻译质量上匹敌70B大模型,同时具备出色的对话和指令跟随能力。研究还创建了IF-MT基准来评估复杂翻译场景下的综合能力,为AI模型的专业化发展提供了重要参考。
    至顶网  科技行者  2025-07-03 10:01:08  
  • ByteDance种子实验室重磅推出VeOmni:让AI训练像搭积木一样简单的全新框架

    ByteDance种子实验室推出VeOmni全模态AI训练框架,通过模块化设计和分布式优化策略,解决了同时训练处理文字、图像、视频、音频等多种数据类型AI模型的技术难题。该框架让300亿参数模型在128个GPU上实现每秒2800+ tokens处理速度,支持16万长度序列,在与主流框架对比中展现显著性能优势。
    至顶网  科技行者  2025-08-07 14:14:57  
  • 机器人也能拥有"人手"?北大团队让机器人学会人类灵巧动作的秘密武器

    北大团队突破性研究Being-H0系统,首次实现让机器人通过观看人类视频学习灵巧手部动作。该系统采用"物理指令调优"方法,在150万个动作样本上训练,达到毫米级精度,在多项复杂操作测试中成功率达60%-100%,仅需传统方法25%的训练数据。这项技术为医疗、制造和服务业机器人应用开辟新前景。
    至顶网  科技行者  2025-07-25 11:46:24  
  • 当AI学会"读心术":斯坦福大学揭秘大脑如何理解语言的神奇机制

    斯坦福大学研究团队开发出革命性AI系统,能够通过分析大脑活动以85%准确率解码人类语言理解过程。研究绘制了包含万余词汇的"大脑词典",揭示语言处理的层次化神经机制,发现大脑存在专门的预测网络和语义枢纽。该技术为治疗失语症、改进教育评估、开发智能AI系统开辟新路径,虽面临个体差异和实时处理等挑战,但已开始临床测试应用。
    至顶网  科技行者  2025-08-08 13:03:20  
  • 斯科尔科夫科技学院推出G-CUT3R:让AI秒懂现实世界的3D重建新玩法

    斯科尔科夫科技学院等机构联合开发的G-CUT3R是一种创新的3D重建技术,通过巧妙融合相机参数、深度信息等辅助数据,显著提升了传统仅依赖RGB图像重建方法的准确性和速度。该技术采用轻量级设计和零卷积融合策略,在多个基准测试中表现出色,为自动驾驶、AR/VR、机器人导航等领域的实际应用开辟了新路径。
    至顶网  科技行者  2025-08-27 15:12:46  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号