用了 0.050936秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容3164 条
  • 蚂蚁集团提出GRAO:让AI模型在"模仿-探索-超越"中实现自我优化的统一对齐框架

    蚂蚁集团智能医疗部门提出GRAO统一对齐框架,通过"模仿-探索-超越"三阶段机制解决传统AI对齐方法局限性。该方法相比监督微调、强化学习等基线方法分别实现57.70%、7.95%等显著提升,特别在专家混合模型上表现突出,为大型语言模型对齐优化提供新范式。
    至顶网  科技行者  2025-08-18 13:56:54  
  • 宾大研究团队开发PIXIE:让计算机仅通过视觉就能预测物理世界的"物理大师"

    宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。
    至顶网  科技行者  2025-09-02 16:03:37  
  • 白川团队推出Baichuan-M2:让AI医生像真正的医生一样思考和对话,在全球最严格医疗测试中击败所有开源模型

    百川智能团队开发的Baichuan-M2是一个32B参数的医疗AI模型,通过创新的动态验证系统突破了传统静态评估局限。该系统包含虚拟患者模拟器和临床评估标准生成器,让AI在真实诊疗环境中学习。在HealthBench测试中,Baichuan-M2获得60.1分超越所有开源模型,在最困难的HealthBench Hard中获得34.7分,成为全球仅有两个突破32分的模型之一。
    至顶网  科技行者  2025-09-23 13:36:38  
  • LMU Munich等机构重磅突破:让超级AI助手在手机上安家的全新联邦学习技术

    这项由德国慕尼黑大学等机构联合完成的研究提出了FedNano框架,创新性地解决了多模态大语言模型在联邦学习中的部署难题。通过将模型拆分为服务器端核心和客户端轻量级NanoEdge模块,结合Fisher合并技术处理数据异质性,实现了95%的存储减少和99%的通信优化,同时保持了优异性能,为AI技术的普及化应用开辟了新路径。
    至顶网  科技行者  2025-06-24 15:44:05  
  • 游戏画面秒变电影级真实感!希腊亚里士多德大学研究团队让虚拟世界瞬间照进现实

    希腊亚里士多德大学研究团队开发了REGEN系统,通过两阶段神经网络框架实现游戏画面的实时真实化增强。该系统先用EPE方法离线生成高质量样本,再训练轻量级网络模仿效果,在《侠盗猎车手5》上实现了30帧每秒的处理速度,比传统方法快32倍且画面质量相当,为游戏产业和AI训练数据生成提供了实用解决方案。
    至顶网  科技行者  2025-09-02 09:31:30  
  • 大型语言模型能力测试大揭秘:中科院团队发布283个评测基准全景分析

    中科院深圳先进技术研究院团队首次全面梳理了大型语言模型评测领域,分析了283个代表性基准,将其归纳为通用能力、领域专业和特定目标三大类别。研究揭示了现有评测体系面临的数据污染、文化偏见和静态评测等关键挑战,为构建更科学公正的AI评测框架提供了重要指导,推动人工智能技术向更安全可靠的方向发展。
    至顶网  科技行者  2025-10-11 09:53:47  
  • 阿里巴巴Qwen2.5-VL:让AI看懂世界的新一代视觉语言模型

    阿里巴巴Qwen团队发布的Qwen2.5-VL是新一代多模态大型语言模型,实现了原生动态分辨率处理、超长视频理解和精确设备操作等突破。该模型提供3B、7B、72B三个版本,在文档理解、视觉定位、多语言处理等任务上达到业界领先水平,训练数据规模扩展至4.1万亿标记,为用户提供更智能实用的AI助手体验。
    至顶网  科技行者  2025-08-26 12:02:44  
  • 从手绘图到3D模型:AI如何让工程师的草图自动变成精密CAD设计

    杭州电子科技大学等多所院校联合研究团队开发出革命性AI系统Drawing2CAD,能够直接从工程图纸自动生成精密三维CAD模型。该系统采用创新的双解码器架构和柔性损失函数,使用矢量格式图纸保留精确几何信息,在多项测试中显著优于传统像素化方法。研究团队还构建了包含15万多个样本的大规模数据集CAD-VGDrawing,为工程设计自动化提供了重要突破。
    至顶网  科技行者  2025-09-19 11:04:00  
  • 揭露Facebook数字货币Libra背后的用例、技术与动机

    Facebook公司透露了关于其加密货币Libra的更多细节,用户可以用它购买商品或者以几乎零手续费的方式向他人汇款。
    至顶网  科技行者  2019-07-02 15:07:50  
  • MiniCPM4:小身材大能量,OpenBMB团队让AI模型跑进手机时代

    OpenBMB团队推出MiniCPM4,通过稀疏注意力、高质量数据处理等四大创新维度,实现8B参数模型仅用22%训练数据达到竞争对手性能,并在端侧设备上实现7倍推理加速。该研究涵盖InfLLM v2架构、UltraClean数据技术、ModelTunnel v2训练优化和CPM.cu推理系统,展示了端侧AI的巨大潜力。
    至顶网  科技行者  2025-06-12 13:06:39  
  • KAUST研究团队推出"魔法疫苗":让AI永远拒绝有害请求的神奇方法

    KAUST研究团队开发的ROSI技术通过识别并放大AI模型内部的"安全方向",实现了轻量级的安全增强。该技术不仅能提升已有模型的安全性和抗攻击能力,还能恢复无审查模型的安全功能,且对模型性能影响微乎其微。这种基于可解释性的内在改造方法为AI安全领域开辟了新道路,具有成本低、效果好、易部署等优势。
    至顶网  科技行者  2025-09-05 10:11:45  
  • 只需输入音频就能生成说话人视频?昆仑集团推出的Skywork R1V让AI同时看懂图片和推理数学

    昆仑公司Skywork AI团队开发的Skywork R1V模型,成功将文本推理能力扩展到视觉领域。该模型仅用380亿参数就实现了与大型闭源模型相媲美的多模态推理性能,在MMMU测试中达到69.0分,在MathVista获得67.5分,同时保持了优秀的文本推理能力。研究团队采用高效的多模态迁移、混合优化框架和自适应推理链蒸馏三项核心技术,成功实现了视觉理解与逻辑推理的完美结合,并将所有代码和权重完全开源。
    至顶网  科技行者  2025-07-16 10:00:07  
  • Skywork AI团队:一个1.5B参数的小模型如何同时掌握图像理解、生成和编辑三项绝技

    Skywork AI团队开发出参数仅1.5亿的统一多模态模型Skywork UniPic,能同时完成图像理解、文字生成图像和图像编辑三项任务。该模型采用创新的双编码器架构,在多个基准测试中达到先进水平,且能在消费级硬件上运行,为多模态AI的普及化应用提供了新方案。
    至顶网  科技行者  2025-08-08 11:54:22  
  • FlowReasoner:新加坡Sea AI Lab团队让AI智能体系统实现"一人一策"的突破性研究

    这是由新加坡Sea AI Lab等机构联合完成的突破性研究,提出了FlowReasoner查询级元智能体系统。该系统能为每个用户查询定制专门的多智能体解决方案,突破了传统"一套方案解决一类问题"的局限。通过推理能力结合外部执行反馈的强化学习,在多个代码生成基准上综合准确率达81.89%,相比o1-mini提升10.52%,代表了AI系统从标准化向个性化发展的重要转折。
    至顶网  科技行者  2025-07-15 10:02:07  
  • 全球首个开源音视频同步生成模型!StepFun团队让AI直接创造带声音的视频

    由StepFun等机构开发的UniVerse-1是全球首个开源音视频同步生成模型,采用创新的"专家缝合"技术融合视频和音频生成专家,配合在线标注流水线解决数据对齐问题,在7600小时训练数据上实现了协调的音视频内容生成,为开源社区提供了完整的技术方案和评估基准。
    至顶网  科技行者  2025-09-22 10:25:59  
  • 当3D建模遇上一秒魔法:腾讯华为联手打造的FlashVDM技术如何让3D创作"飞起来"

    这项由腾讯混元实验室联合多所知名大学完成的研究,成功将3D模型生成时间从30多秒压缩到不到1秒,实现32倍速度提升。该技术通过创新的渐进式流程蒸馏和闪电向量解码器,在保持生成质量的同时大幅提升了效率,为游戏开发、建筑设计、影视制作等领域带来革命性改变,使3D内容创作从专业技能变成人人可用的日常工具。
    至顶网  科技行者  2025-07-31 09:57:03  
  • 打造更公平的AI训练:Mozilla和EleutherAI联手制定开放数据集最佳实践指南

    Mozilla和EleutherAI联合发布了一份关于创建开放授权大语言模型训练数据集的最佳实践指南。该研究通过召集30位专家,制定了七个核心原则和详细的技术建议,旨在解决当前AI训练数据版权争议、透明度不足等问题,推动构建更加开放、公平和可持续的AI生态系统,为未来AI发展提供了重要的指导框架。
    至顶网  科技行者  2025-09-17 13:32:48  
  • 香港科技大学新技术:AI也能像PS高手一样精准换形状

    香港科技大学研究团队提出Follow-Your-Shape技术,通过创新的轨迹分歧图机制实现精准的AI图像形状编辑。该方法无需遮罩和训练,能准确识别编辑区域并保持背景完整,在新构建的ReShapeBench基准测试中全面超越现有方法,为创意设计、广告制作和内容创作等领域提供强大工具支持。
    至顶网  科技行者  2025-08-14 10:28:24  
  • 字节跳动推出Seedance 1.0:让AI视频生成快到飞起的新神器

    字节跳动Seed团队推出的Seedance 1.0是一个突破性的AI视频生成模型,能够根据文字描述或静态图片快速生成高质量视频。该系统在权威评测平台上击败了Google Veo 3、OpenAI Sora等竞品,获得双项冠军。其核心创新包括多模态统一架构、空间时间分离设计、强化学习优化和10倍推理加速,能在41.4秒内生成5秒1080p视频,大幅降低了专业视频制作门槛。
    至顶网  科技行者  2025-06-17 09:46:47  
  • GLiClass:轻量级文本分类的全能新秀,从乌克兰基辅走向世界的AI突破

    GLiClass是由乌克兰基辅Knowledgator工程公司开发的创新文本分类模型,基于GLiNER架构改进而成。该模型通过联合编码文本和标签,在单次前向传递中完成多标签分类,实现了准确性与效率的完美平衡。测试显示,GLiClass不仅在准确性上超越强基准模型5.5%,处理速度更是比传统交叉编码器快2.3-16倍,特别是在大标签集场景下优势明显。模型已开源并提供多个规模版本以适应不同应用需求。
    至顶网  科技行者  2025-08-14 12:44:58  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号