搜一下
用了 0.042953秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容2143 条
谷歌DeepMind发布AlphaEvolve:会自己编程进化的AI智能体,破解56年未解数学难题
谷歌DeepMind发布AlphaEvolve:会自己编程进化的AI智能体,破解56年未解数学难题
至顶网
至顶AI实验室 2025-06-25 16:46:50
AI视频生成新突破:天工AI让你用几张照片就能拍出好莱坞大片
天工AI推出的SkyReels-A2视频生成系统实现了重大突破,能够将多张不相关照片智能组合成高质量视频。该技术采用双分支架构处理语义和空间信息,通过200万训练样本学习元素组合规律。在与商业模型的对比中表现出色,特别是在物体一致性和视觉质量方面领先。该系统已开源,为创意产业、教育培训、虚拟电商等领域带来革命性应用前景。
至顶网
科技行者 2025-07-14 09:49:31
蚂蚁集团提出GRAO:让AI模型在"模仿-探索-超越"中实现自我优化的统一对齐框架
蚂蚁集团智能医疗部门提出GRAO统一对齐框架,通过"模仿-探索-超越"三阶段机制解决传统AI对齐方法局限性。该方法相比监督微调、强化学习等基线方法分别实现57.70%、7.95%等显著提升,特别在专家混合模型上表现突出,为大型语言模型对齐优化提供新范式。
至顶网
科技行者 2025-08-18 13:56:54
苹果公司颠覆蛋白质折叠:SimpleFold让复杂生物学变得简单如变魔术
苹果公司发布SimpleFold,这是首个基于流匹配的蛋白质折叠模型,完全使用通用Transformer架构。该模型摒弃了传统方法中的多序列比对、配对表示等复杂组件,在保持竞争性能的同时实现了20倍以上的计算效率提升。SimpleFold支持多样性结构生成,在标准基准测试中表现出色,并展现良好的扩展性。
至顶网
科技行者 2025-10-15 12:07:58
宾大研究团队开发PIXIE:让计算机仅通过视觉就能预测物理世界的"物理大师"
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。
至顶网
科技行者 2025-09-02 16:03:37
机器人也能学会"七十二变"?清华大学团队让机器人从视频中学会灵巧操作
清华大学研究团队开发了HERMES系统,让机器人能通过观看人类操作视频学会复杂双手协作任务。该系统融合多源数据,采用通用奖励机制和虚实结合训练方法,配备精确导航定位能力。实验显示平均成功率达67.8%,在医疗、制造、家庭服务等领域展现广阔应用前景,代表了机器人从数据驱动向理解式学习的重要进展。
至顶网
科技行者 2025-09-05 10:12:55
LMU Munich等机构重磅突破:让超级AI助手在手机上安家的全新联邦学习技术
这项由德国慕尼黑大学等机构联合完成的研究提出了FedNano框架,创新性地解决了多模态大语言模型在联邦学习中的部署难题。通过将模型拆分为服务器端核心和客户端轻量级NanoEdge模块,结合Fisher合并技术处理数据异质性,实现了95%的存储减少和99%的通信优化,同时保持了优异性能,为AI技术的普及化应用开辟了新路径。
至顶网
科技行者 2025-06-24 15:44:05
上海AI实验室团队突破视觉推理难题:让AI也能像人类一样"看图解题"
上海AI实验室团队开发的MM-Eureka突破了多模态视觉推理难题,这是一个能同时理解图像和文字并进行复杂推理的AI系统。通过创新的强化学习训练策略和高质量的MMK12数据集,MM-Eureka不仅在数学推理上表现出色,还展现出惊人的跨学科推理能力,在物理、化学、生物等领域都有优异表现,性能接近OpenAI的o1模型。研究团队将所有成果完全开源,为AI研究社区提供了宝贵资源。
至顶网
科技行者 2025-08-01 10:15:26
南洋理工大学团队重大突破:让AI像人类一样"会反思"的GUI自动化智能体
这项来自南洋理工大学和商汤科技的开创性研究,首次系统性地为GUI自动化AI赋予了人类般的自我反思和错误纠正能力。通过创新的三阶段训练框架和自动化数据生成技术,成功让AI学会了识别错误、撤销操作和从失败中学习,在复杂任务上的成功率提升了138%。这一突破不仅推动了GUI自动化技术的发展,更为构建真正智能的AI系统提供了新的范式。
至顶网
科技行者 2025-06-12 08:09:39
阿里巴巴Qwen2.5-VL:让AI看懂世界的新一代视觉语言模型
阿里巴巴Qwen团队发布的Qwen2.5-VL是新一代多模态大型语言模型,实现了原生动态分辨率处理、超长视频理解和精确设备操作等突破。该模型提供3B、7B、72B三个版本,在文档理解、视觉定位、多语言处理等任务上达到业界领先水平,训练数据规模扩展至4.1万亿标记,为用户提供更智能实用的AI助手体验。
至顶网
科技行者 2025-08-26 12:02:44
华为技术团队首次全面解析AI智能研究助手的"大脑升级秘籍"
华为技术团队发布突破性研究,首次系统阐述如何通过强化学习训练AI研究助手。研究涵盖数据合成、训练方法、系统框架、协作机制和评估标准五大核心领域,提出从"模仿学习"向"探索学习"的范式转变,让AI具备类似人类研究员的多步骤推理、工具使用和知识综合能力,为AI研究助手的实用化部署提供完整技术路径。
至顶网
科技行者 2025-09-23 11:05:14
香港科技大学团队让电脑听音识画面:仅凭声音就能生成逼真视频
香港科技大学研究团队开发出SpA2V框架,这是首个能够从音频中提取空间信息并生成对应视频的AI系统。该技术不仅能识别声音类型,还能准确判断声源位置、移动方向和距离,通过两阶段生成过程实现"听音生画"。实验结果显示SpA2V在空间对应性和视频质量方面显著超越现有方法,为音频可视化、影视制作、教育应用等领域开辟了新的可能性。
至顶网
科技行者 2025-08-07 10:21:55
揭露Facebook数字货币Libra背后的用例、技术与动机
Facebook公司透露了关于其加密货币Libra的更多细节,用户可以用它购买商品或者以几乎零手续费的方式向他人汇款。
至顶网
科技行者 2019-07-02 15:07:50
MiniCPM4:小身材大能量,OpenBMB团队让AI模型跑进手机时代
OpenBMB团队推出MiniCPM4,通过稀疏注意力、高质量数据处理等四大创新维度,实现8B参数模型仅用22%训练数据达到竞争对手性能,并在端侧设备上实现7倍推理加速。该研究涵盖InfLLM v2架构、UltraClean数据技术、ModelTunnel v2训练优化和CPM.cu推理系统,展示了端侧AI的巨大潜力。
至顶网
科技行者 2025-06-12 13:06:39
只需输入音频就能生成说话人视频?昆仑集团推出的Skywork R1V让AI同时看懂图片和推理数学
昆仑公司Skywork AI团队开发的Skywork R1V模型,成功将文本推理能力扩展到视觉领域。该模型仅用380亿参数就实现了与大型闭源模型相媲美的多模态推理性能,在MMMU测试中达到69.0分,在MathVista获得67.5分,同时保持了优秀的文本推理能力。研究团队采用高效的多模态迁移、混合优化框架和自适应推理链蒸馏三项核心技术,成功实现了视觉理解与逻辑推理的完美结合,并将所有代码和权重完全开源。
至顶网
科技行者 2025-07-16 10:00:07
Skywork AI团队:一个1.5B参数的小模型如何同时掌握图像理解、生成和编辑三项绝技
Skywork AI团队开发出参数仅1.5亿的统一多模态模型Skywork UniPic,能同时完成图像理解、文字生成图像和图像编辑三项任务。该模型采用创新的双编码器架构,在多个基准测试中达到先进水平,且能在消费级硬件上运行,为多模态AI的普及化应用提供了新方案。
至顶网
科技行者 2025-08-08 11:54:22
Sber AI团队突破视频生成瓶颈:让超高清视频制作快2.7倍的神奇算法
俄罗斯Sber AI团队开发出NABLA算法,通过邻域自适应块级注意力机制实现AI视频生成2.7倍加速。该算法采用三步优化:降维侦察、智能筛选和精确映射,动态识别重要注意力区域,在保持视频质量的同时大幅减少计算开销,为高效AI视频生成提供新解决方案。
至顶网
科技行者 2025-07-29 17:15:17
南洋理工大学团队革命性突破:让AI绘画像艺术家一样从粗到细,一步步创作精美图像
南洋理工大学研究团队开发的NVG技术革新了AI图像生成方式,让AI学会像画家一样分层创作。该技术将图像分解为9个粒度层次,从整体构图到精细细节逐步生成,不仅提高了图像质量,还提供了前所未有的结构控制能力。在多项评测中NVG均优于现有方法,仅需9步即可生成高质量图像,为数字艺术创作和AI可控生成开辟了新路径。
至顶网
科技行者 2025-08-27 10:00:48
AGI万字长文(上) | 2023回顾与反思
2023年大众对AI的看法从怀疑到认可,AGI(通用人工智能)的发展迅速,大模型展现出惊人的想象力和取悦能力。应用层尚未出现独角兽,创业者面临官方技术迭代的挑战。
至顶网
AIGC开放社区 2024-03-14 15:04:20
FlowReasoner:新加坡Sea AI Lab团队让AI智能体系统实现"一人一策"的突破性研究
这是由新加坡Sea AI Lab等机构联合完成的突破性研究,提出了FlowReasoner查询级元智能体系统。该系统能为每个用户查询定制专门的多智能体解决方案,突破了传统"一套方案解决一类问题"的局限。通过推理能力结合外部执行反馈的强化学习,在多个代码生成基准上综合准确率达81.89%,相比o1-mini提升10.52%,代表了AI系统从标准化向个性化发展的重要转折。
至顶网
科技行者 2025-07-15 10:02:07
<
上一页
100
101
102
103
104
105
106
107
108
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号