用了 0.124743秒,为您找到大发 玩和值 稳定 中方 法规 罔芷 88pkee 驻测相关内容9131 条
  • 腾讯深圳大学革命性突破:让电脑理解语言的秘密武器终于诞生

    腾讯和深圳大学联合开发的多视角语言理解技术取得重大突破,通过创新的训练方法让人工智能具备接近人类水平的语言理解能力。系统能准确识别讽刺、情感变化等复杂语言现象,在多项测试中表现优异,已在客服、教育、医疗等领域开始应用,未来有望广泛改善人机交互体验。
    至顶网  科技行者  2025-08-27 10:31:04  
  • 上海交通大学团队突破:让AI轻松读懂复杂表格,像人类一样理解数据关系!

    上海交通大学团队开发了名为ST-Raptor的智能系统,能够像人类专家一样准确理解医疗报告、财务报表等复杂表格结构。该系统创新性地使用"层次正交树"表示方法和九种基础操作工具,配合智能问题分解和双重验证机制,在复杂表格分析任务中准确率达到72.39%,比现有最佳方法提升20%以上,有望广泛应用于医疗、金融、教育等领域。
    至顶网  科技行者  2025-09-01 15:51:48  
  • ByteDance Seed研究团队发布BAGEL:探索统一多模态预训练中的涌现能力

    ByteDance Seed团队发布的BAGEL是一个突破性开源基础模型,采用混合变换器专家架构,能同时执行多模态理解和生成任务。研究显示,随着训练数据和模型规模增加,BAGEL展现"涌现能力"—从基础理解和生成,到复杂编辑和自由形式视觉操作,再到长上下文推理,呈现能力阶梯式提升。模型在标准基准测试中超越现有开源统一模型,并显示出强大的世界建模能力,如世界导航和视频生成。研究团队开源了代码和模型检查点,为多模态AI研究开辟新方向。
    至顶网  科技行者  2025-05-26 08:20:53  
  • 莫斯科国立大学团队用AI进化算法创造工业级CAD设计,让计算机也能当工程师

    这项由莫斯科国立大学等机构完成的研究通过AI进化算法解决了CAD训练数据稀缺问题,创建了包含130万个脚本的工业级数据集CADEvolve,其中的AI模型能将图像直接转换为复杂的CAD程序,在三个权威基准上达到最先进性能,为AI辅助工程设计开辟了新方向。
    至顶网  科技行者  2026-02-25 15:36:33  
  • 全景虚拟世界的"修补术":NVIDIA与台湾交大联手解决360度场景中物体消失的技术难题

    台湾阳明交通大学与NVIDIA联合开发的AuraFusion360技术,首次实现了360度全景场景中物体完美移除和空缺自然填补。该技术通过深度感知识别、自适应深度扩散和智能纹理融合三大创新,解决了传统方法在多视角一致性方面的难题,为VR/AR、房地产、旅游等行业的360度内容制作提供了革命性工具。
    至顶网  科技行者  2025-08-20 18:06:48  
  • 专家发现AI图像生成模型的"记忆删除"其实是假象:CISPA等机构揭示文生图模型记忆机制真相

    德国研究机构发现AI图像生成模型的记忆删除技术存在严重缺陷,现有权重修剪方法只是表面隐藏记忆而非真正删除。研究团队开发的Dori技术能够绕过这些防护措施,重新激活看似已被遗忘的训练数据。他们提出的对抗性微调解决方案通过重塑AI整体行为模式实现更可靠的记忆消除,为AI安全和版权保护提供了新思路。
    至顶网  科技行者  2025-07-28 15:32:28  
  • 早稻田大学团队重磅发布:AI看懂旅游视频后竟能制定完美旅行攻略

    早稻田大学研究团队开发了VIR-Bench基准,通过200个日本旅游视频测试AI理解地理空间和时间序列的能力。研究发现即使最先进的AI模型在复杂地理推理和时间顺序理解上仍有局限,但开发的AI旅行规划助手在结合多源信息时已能生成实用的旅行方案。
    至顶网  科技行者  2025-10-14 12:09:09  
  • 字节跳动AI团队推出UNO:图像"魔法师"实现从一到多主题的自由创作

    字节跳动AI团队推出的UNO系统实现了图像生成领域的重要突破,能够根据参考图片生成新场景,并首次很好地解决了多主题图像生成的技术难题。该系统采用创新的渐进式训练策略和自动化数据生成技术,在保持参考物体特征的同时实现了灵活的场景创作,为创意产业提供了强大的AI辅助工具。
    至顶网  科技行者  2025-07-14 09:48:45  
  • 上海AI实验室团队突破视觉推理难题:让AI也能像人类一样"看图解题"

    上海AI实验室团队开发的MM-Eureka突破了多模态视觉推理难题,这是一个能同时理解图像和文字并进行复杂推理的AI系统。通过创新的强化学习训练策略和高质量的MMK12数据集,MM-Eureka不仅在数学推理上表现出色,还展现出惊人的跨学科推理能力,在物理、化学、生物等领域都有优异表现,性能接近OpenAI的o1模型。研究团队将所有成果完全开源,为AI研究社区提供了宝贵资源。
    至顶网  科技行者  2025-08-01 10:15:26  
  • 腾讯团队让AI学会在游戏中边玩边学:从"知道"到"会做"的智能飞跃

    腾讯研究团队提出Think-In-Games(TiG)框架,成功解决大语言模型"知道但不会做"的核心问题。该方法通过让AI在《王者荣耀》游戏中实际互动学习,将强化学习与语言模型优势结合,使AI既能做出正确决策又能解释推理过程。实验显示14B参数小模型性能超越671B大模型,证明了专门化训练的有效性。
    至顶网  科技行者  2025-10-10 09:56:14  
  • M-A-P团队发布COIG-P:首个百万级中文人工智能偏好训练数据集,重新定义AI中文对话能力

    M-A-P团队发布的COIG-P数据集包含100万个高质量中文偏好样本对,通过15个AI模型协作生成和8个AI评委评分构建。该数据集覆盖对话、编程、数学等六大领域,显著提升了中文AI模型性能,相关模型在AlignBench评测中获得2%-12%的性能提升。团队还开源了中文奖励模型CRM和评估基准CRBench,为中文AI社区提供了重要的开源基础设施。
    至顶网  科技行者  2025-07-15 09:59:24  
  • 阿里巴巴推出ThinkSound:让AI像音效师一样"思考"创造声音

    阿里巴巴联合香港科技大学和浙江大学开发的ThinkSound系统,通过引入思维链推理让AI学会像专业音效师一样思考和创作。该系统采用三步式交互流程,支持基础音景生成、物体定制和语言编辑,在多项评测中表现优异,有望降低音效制作门槛并提升创作效率。
    至顶网  科技行者  2025-07-02 11:24:54  
  • MIT实验室打造音频界"翻译官":一个模型搞定语音、音乐和环境声

    这篇论文介绍了MIT开发的USAD技术,这是一种能够同时理解语音、音乐和环境声音的通用音频AI模型。通过创新的知识蒸馏方法,USAD在多个音频处理任务上都达到了接近专门模型的性能水平,为构建更智能的音频理解系统奠定了基础。该技术在智能助手、多媒体处理、教育等领域具有广阔的应用前景。
    至顶网  科技行者  2025-06-27 16:59:36  
  • 华为技术团队首次全面解析AI智能研究助手的"大脑升级秘籍"

    华为技术团队发布突破性研究,首次系统阐述如何通过强化学习训练AI研究助手。研究涵盖数据合成、训练方法、系统框架、协作机制和评估标准五大核心领域,提出从"模仿学习"向"探索学习"的范式转变,让AI具备类似人类研究员的多步骤推理、工具使用和知识综合能力,为AI研究助手的实用化部署提供完整技术路径。
    至顶网  科技行者  2025-09-23 11:05:14  
  • 香港科技大学团队让电脑听音识画面:仅凭声音就能生成逼真视频

    香港科技大学研究团队开发出SpA2V框架,这是首个能够从音频中提取空间信息并生成对应视频的AI系统。该技术不仅能识别声音类型,还能准确判断声源位置、移动方向和距离,通过两阶段生成过程实现"听音生画"。实验结果显示SpA2V在空间对应性和视频质量方面显著超越现有方法,为音频可视化、影视制作、教育应用等领域开辟了新的可能性。
    至顶网  科技行者  2025-08-07 10:21:55  
  • 香港大学与字节跳动联手打造的Goku:让AI同时掌握图片和视频生成的"变形金刚"

    香港大学与字节跳动联合开发了名为Goku的AI模型,能够同时生成高质量图片和视频。该模型采用修正流技术和统一训练架构,使用1.6亿张图片和3600万段视频训练,在多项评测中达到业界领先水平,在VBench视频测试中获得84.85分,GenEval图片测试中达到0.76分,展现了AI视觉生成技术向通用化发展的新趋势。
    至顶网  科技行者  2025-08-25 14:27:23  
  • Meta AI研究院重新定义人工智能视觉理解:DINOv3让机器拥有堪比人眼的识别能力

    Meta AI研究院开发的DINOv3是一项革命性的自监督学习视觉模型,通过观察16.89亿张未标注图片学会理解图像。该模型采用创新的Gram锚定技术解决大规模训练难题,在目标检测、图像分割、深度估计等多个任务上达到业界最高水平,并成功应用于卫星遥感、医学影像等专业领域,为人工智能视觉理解能力的发展开辟了新路径。
    至顶网  科技行者  2025-10-10 10:31:18  
  • RefCritic:中科院团队突破AI"教师"难题,让机器像人类老师一样纠错指导

    中科院软件所与阿里巴巴合作开发的RefCritic系统,首次让AI具备了真正的"教学能力"。通过创新的双重奖励机制,该系统不仅能准确判断答案对错,更能提供切实有效的改进指导。在数学竞赛等高难度测试中,RefCritic指导下的学生正确率提升超过7%,甚至能够指导比自己更强大的AI模型,展现了"授人以渔"的智能新范式。
    至顶网  科技行者  2025-07-28 10:16:44  
  • 加州理工学院全新突破:让AI同时"看懂"文字、图片和3D世界的革命性技术

    加州理工学院研究团队开发出名为Kyvo的突破性AI系统,首次实现文字、图像和3D空间信息的统一处理。该系统通过创新的"结构化3D表示法"和"统一token空间"技术,让AI能够同时理解和生成三种不同类型的信息。在四大核心任务(3D渲染、识别、指令跟随、问答)中表现出色,为设计、机器人、AR/VR等领域带来重要应用前景。
    至顶网  科技行者  2025-06-16 09:43:01  
  • 标题:《数字经济洞察周报》2023年第11期 | NVIDIA举办GTC 2023大会

    摘要:本周,NVIDIA举办GTC 2023大会,推出AI Foundations云服务等解决方案。
    至顶网  孙硕 宿硕  2023-03-24 21:33:17  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号