用了 0.056196秒,为您找到大发 大小 单双 有人 带么罔芷 88pkee 驻测相关内容3971 条
  • 苹果公司颠覆蛋白质折叠:SimpleFold让复杂生物学变得简单如变魔术

    苹果公司发布SimpleFold,这是首个基于流匹配的蛋白质折叠模型,完全使用通用Transformer架构。该模型摒弃了传统方法中的多序列比对、配对表示等复杂组件,在保持竞争性能的同时实现了20倍以上的计算效率提升。SimpleFold支持多样性结构生成,在标准基准测试中表现出色,并展现良好的扩展性。
    至顶网  科技行者  2025-10-15 12:07:58  
  • 宾大研究团队开发PIXIE:让计算机仅通过视觉就能预测物理世界的"物理大师"

    宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。
    至顶网  科技行者  2025-09-02 16:03:37  
  • 香港大学与字节跳动联手打造的Goku:让AI同时掌握图片和视频生成的"变形金刚"

    香港大学与字节跳动联合开发了名为Goku的AI模型,能够同时生成高质量图片和视频。该模型采用修正流技术和统一训练架构,使用1.6亿张图片和3600万段视频训练,在多项评测中达到业界领先水平,在VBench视频测试中获得84.85分,GenEval图片测试中达到0.76分,展现了AI视觉生成技术向通用化发展的新趋势。
    至顶网  科技行者  2025-08-25 14:27:23  
  • 哈佛大学研究突破:训练AI时"删除"不良概念,让模型变得更安全可靠

    哈佛大学研究团队开发出革命性的"概念消融微调"技术,能在AI训练过程中精准识别并移除有害概念,就像外科手术般精确。该技术成功解决了AI"意外学习"问题,让模型在掌握目标技能的同时避免不良行为,有害响应率降低90%。这为创造更安全可靠的AI系统提供了新路径。
    至顶网  科技行者  2025-07-28 10:15:58  
  • 机器人也能学会"七十二变"?清华大学团队让机器人从视频中学会灵巧操作

    清华大学研究团队开发了HERMES系统,让机器人能通过观看人类操作视频学会复杂双手协作任务。该系统融合多源数据,采用通用奖励机制和虚实结合训练方法,配备精确导航定位能力。实验显示平均成功率达67.8%,在医疗、制造、家庭服务等领域展现广阔应用前景,代表了机器人从数据驱动向理解式学习的重要进展。
    至顶网  科技行者  2025-09-05 10:12:55  
  • LMU Munich等机构重磅突破:让超级AI助手在手机上安家的全新联邦学习技术

    这项由德国慕尼黑大学等机构联合完成的研究提出了FedNano框架,创新性地解决了多模态大语言模型在联邦学习中的部署难题。通过将模型拆分为服务器端核心和客户端轻量级NanoEdge模块,结合Fisher合并技术处理数据异质性,实现了95%的存储减少和99%的通信优化,同时保持了优异性能,为AI技术的普及化应用开辟了新路径。
    至顶网  科技行者  2025-06-24 15:44:05  
  • 上海AI实验室团队突破视觉推理难题:让AI也能像人类一样"看图解题"

    上海AI实验室团队开发的MM-Eureka突破了多模态视觉推理难题,这是一个能同时理解图像和文字并进行复杂推理的AI系统。通过创新的强化学习训练策略和高质量的MMK12数据集,MM-Eureka不仅在数学推理上表现出色,还展现出惊人的跨学科推理能力,在物理、化学、生物等领域都有优异表现,性能接近OpenAI的o1模型。研究团队将所有成果完全开源,为AI研究社区提供了宝贵资源。
    至顶网  科技行者  2025-08-01 10:15:26  
  • 南洋理工大学团队重大突破:让AI像人类一样"会反思"的GUI自动化智能体

    这项来自南洋理工大学和商汤科技的开创性研究,首次系统性地为GUI自动化AI赋予了人类般的自我反思和错误纠正能力。通过创新的三阶段训练框架和自动化数据生成技术,成功让AI学会了识别错误、撤销操作和从失败中学习,在复杂任务上的成功率提升了138%。这一突破不仅推动了GUI自动化技术的发展,更为构建真正智能的AI系统提供了新的范式。
    至顶网  科技行者  2025-06-12 08:09:39  
  • 阿里巴巴Qwen2.5-VL:让AI看懂世界的新一代视觉语言模型

    阿里巴巴Qwen团队发布的Qwen2.5-VL是新一代多模态大型语言模型,实现了原生动态分辨率处理、超长视频理解和精确设备操作等突破。该模型提供3B、7B、72B三个版本,在文档理解、视觉定位、多语言处理等任务上达到业界领先水平,训练数据规模扩展至4.1万亿标记,为用户提供更智能实用的AI助手体验。
    至顶网  科技行者  2025-08-26 12:02:44  
  • 人大研究团队颠覆传统:不用巨型AI模型,也能轻松理解超长视频内容

    这项由中国人民大学团队主导的研究提出了VideoDeepResearch框架,颠覆了长视频理解的传统方法。该系统采用文本推理模型配合多模态工具箱的设计,通过智能搜索策略实现对超长视频的精准理解,在多个权威测试中超越GPT-4o等顶级模型,同时显著降低计算成本,为视频AI应用开辟了新路径。
    至顶网  科技行者  2025-06-18 09:54:28  
  • 对话高通孟樸:自研Oryon CPU背后,是移动计算边界的再定义

    骁龙峰会2024期间,高通中国区董事长孟樸接受了科技行者等媒体的采访,话题围绕自研芯片架构的故事、端侧AI的逻辑、汽车业务的布局、高通在中国市场的发展格局等内容展开。
    至顶网  周雅  2024-10-26 10:26:16  
  • 香港科技大学团队让电脑听音识画面:仅凭声音就能生成逼真视频

    香港科技大学研究团队开发出SpA2V框架,这是首个能够从音频中提取空间信息并生成对应视频的AI系统。该技术不仅能识别声音类型,还能准确判断声源位置、移动方向和距离,通过两阶段生成过程实现"听音生画"。实验结果显示SpA2V在空间对应性和视频质量方面显著超越现有方法,为音频可视化、影视制作、教育应用等领域开辟了新的可能性。
    至顶网  科技行者  2025-08-07 10:21:55  
  • 当善良声音变身恶意武器:AIM Intelligence团队揭秘音频AI的隐藏危机

    AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
    至顶网  科技行者  2025-08-13 14:37:47  
  • MiniCPM4:小身材大能量,OpenBMB团队让AI模型跑进手机时代

    OpenBMB团队推出MiniCPM4,通过稀疏注意力、高质量数据处理等四大创新维度,实现8B参数模型仅用22%训练数据达到竞争对手性能,并在端侧设备上实现7倍推理加速。该研究涵盖InfLLM v2架构、UltraClean数据技术、ModelTunnel v2训练优化和CPM.cu推理系统,展示了端侧AI的巨大潜力。
    至顶网  科技行者  2025-06-12 13:06:39  
  • 「人间清醒」80后程序员川哥

    在一个焦虑的环境里,做一个淡定从容的人。
    至顶网  至顶网码客人生频道  2022-05-27 15:14:34  
  • 只需输入音频就能生成说话人视频?昆仑集团推出的Skywork R1V让AI同时看懂图片和推理数学

    昆仑公司Skywork AI团队开发的Skywork R1V模型,成功将文本推理能力扩展到视觉领域。该模型仅用380亿参数就实现了与大型闭源模型相媲美的多模态推理性能,在MMMU测试中达到69.0分,在MathVista获得67.5分,同时保持了优秀的文本推理能力。研究团队采用高效的多模态迁移、混合优化框架和自适应推理链蒸馏三项核心技术,成功实现了视觉理解与逻辑推理的完美结合,并将所有代码和权重完全开源。
    至顶网  科技行者  2025-07-16 10:00:07  
  • 伊利诺伊大学新突破:让机器像法官一样剖析复杂争议,不再简单判"真假"

    伊利诺伊大学研究团队开发了CLAIMSPECT系统,通过层次化分解复杂争议、智能检索相关文献、多角度收集观点的方法,将传统的"真假"判断转变为多维度分析。该系统能够自动构建争议话题的分析框架,识别不同观点及其支撑证据,为科学和政治争议提供更全面客观的分析,已在生物医学和国际关系领域验证有效性。
    至顶网  科技行者  2025-06-18 13:07:24  
  • Skywork AI团队:一个1.5B参数的小模型如何同时掌握图像理解、生成和编辑三项绝技

    Skywork AI团队开发出参数仅1.5亿的统一多模态模型Skywork UniPic,能同时完成图像理解、文字生成图像和图像编辑三项任务。该模型采用创新的双编码器架构,在多个基准测试中达到先进水平,且能在消费级硬件上运行,为多模态AI的普及化应用提供了新方案。
    至顶网  科技行者  2025-08-08 11:54:22  
  • Sber AI团队突破视频生成瓶颈:让超高清视频制作快2.7倍的神奇算法

    俄罗斯Sber AI团队开发出NABLA算法,通过邻域自适应块级注意力机制实现AI视频生成2.7倍加速。该算法采用三步优化:降维侦察、智能筛选和精确映射,动态识别重要注意力区域,在保持视频质量的同时大幅减少计算开销,为高效AI视频生成提供新解决方案。
    至顶网  科技行者  2025-07-29 17:15:17  
  • 南洋理工大学团队革命性突破:让AI绘画像艺术家一样从粗到细,一步步创作精美图像

    南洋理工大学研究团队开发的NVG技术革新了AI图像生成方式,让AI学会像画家一样分层创作。该技术将图像分解为9个粒度层次,从整体构图到精细细节逐步生成,不仅提高了图像质量,还提供了前所未有的结构控制能力。在多项评测中NVG均优于现有方法,仅需9步即可生成高质量图像,为数字艺术创作和AI可控生成开辟了新路径。
    至顶网  科技行者  2025-08-27 10:00:48  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号