搜一下
用了 0.332860秒,为您找到
宝宝
计划
手机
软件
網纸
YB233
相关内容27718 条
苹果团队突破性研究:让AI既能并行思考又能准确编程的神奇模型DiffuCoder
苹果公司联合香港大学开发了DiffuCoder,这是首个采用扩散模型的AI编程助手,能够像人类程序员一样进行全局思考和并行生成代码。该模型通过创新的"耦合GRPO"强化学习算法,在EvalPlus等权威测试中性能提升4.4%,并实现了更快的代码生成速度。这项研究为AI编程助手从线性生成向智能化并行思考的转变奠定了基础。
至顶网
科技行者 2025-07-03 13:59:53
KAUST研究团队首创AI检查员:让机器像人一样发现图片生成中的"穿帮镜头"
KAUST研究团队开发的Mind-the-Glitch系统首次实现了AI图片生成中视觉一致性的精确检测和定位。该系统通过分离扩散模型的语义和视觉特征,创新性地解决了传统方法只能给出整体评分却无法指出具体问题位置的难题。其提出的VSM指标在测试中显著优于CLIP、DINO等现有方法,为AI图片生成质量评估提供了新的标准工具。
至顶网
科技行者 2025-10-17 14:01:24
MOSI.AI推出革命性音频智能助手:告别字幕时代,迎接全能语音新纪元
MOSI.AI联合复旦大学推出MOSS-Audio-Tokenizer,这是首个完全基于Transformer架构的端到端音频标记器。该系统采用统一架构处理语音、音乐和环境声音,支持0.125-4kbps可变比特率,在16亿参数规模下实现了全面超越现有开源模型的重建质量。基于此架构开发的语音合成系统成为首个性能超越级联系统的纯自回归模型,为未来音频基础模型发展提供了可扩展的统一接口。
至顶网
科技行者 2026-03-12 12:44:07
斯坦福最新突破:AI学会像婴儿一样理解世界,发现物理运动的秘密
斯坦福神经AI实验室开发出SpelkeNet系统,通过"虚拟戳击"让AI像婴儿一样理解物体的物理结构。该系统不依赖外观特征,而是模拟物理力作用来发现哪些像素会一起移动。在物体操作任务中表现显著优于传统方法,并意外展现出对支撑关系和材料属性的理解能力。
至顶网
科技行者 2025-07-29 12:01:43
推荐系统也要"三思而后行":中国人民大学发现让AI推荐更聪明的新方法
中国人民大学研究团队开发了ReaRec推荐系统,让AI学会"三思而后行"。不同于传统推荐系统的直接反应,ReaRec通过多步推理深度理解用户需求,特别擅长为新用户和小众商品提供精准推荐。实验显示平均性能提升7.49%,理论上限可达30-50%提升,为推荐系统开辟了推理时计算的全新方向。
至顶网
科技行者 2025-07-30 20:48:50
字节跳动团队突破性成果:让AI记住你的脸,随心所欲重塑照片的新技术
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。
至顶网
科技行者 2025-07-30 10:00:39
香港中文大学团队发现AI思考链的惊人秘密:80%的推理步骤竟然是多余的!
香港中文大学团队发现AI推理过程中存在高达80%的冗余步骤。通过创新的"步骤熵"方法,他们能够识别并删除这些多余的推理步骤,在保持准确性的同时实现35-57%的效率提升。研究开发了两阶段训练策略,让AI学会自动生成压缩的思考链。这项突破为AI系统的高效部署提供了新途径,有望显著降低AI服务的计算成本和响应时间。
至顶网
科技行者 2025-08-14 12:47:16
谷歌DeepMind如何让AI训练变成一场400倍节省带宽的魔术
谷歌DeepMind推出Streaming DiLoCo技术,通过流式同步、重叠通信和4位量化压缩三项创新,将大规模AI模型训练的带宽需求降低400倍。该方法在保持模型质量几乎不变的前提下,让普通研究机构也能负担得起超大规模AI训练,有望推动AI技术民主化发展。
至顶网
科技行者 2025-09-15 10:38:21
腾讯混元团队推出P3-SAM:让AI像人一样精准拆解3D物体
腾讯混元团队推出P3-SAM系统,这是首个能够自动精确分割任意3D物体的AI模型。该系统采用原生3D处理方式,摆脱了传统方法对2D投影的依赖,在近370万个3D模型上训练而成。P3-SAM支持完全自动分割和交互式分割两种模式,在多个标准测试中达到领先性能,为游戏开发、工业设计等领域提供了强大的3D理解工具。
至顶网
科技行者 2025-09-19 11:08:24
AI大模型批评能力大考验:为什么o1-mini脱颖而出?中科大深圳团队揭示传统模型批评能力之痛
中科大深圳团队开发RealCritic框架,发现AI大模型普遍存在批评能力缺陷。除o1-mini外,多数模型在自我批评时表现下降,甚至把正确答案改错。研究揭示"会做题"和"会批评"是不同技能,提出闭环评估新方法,为AI批评能力评估提供科学标准。
至顶网
科技行者 2025-09-15 14:41:26
中科院团队打造史上首个1比特机器人"保姆":只用29.8%内存就能干活,让家用机器人成为可能!
中科院团队首次开发出1比特视觉-语言-动作模型BitVLA,实现机器人智能操作的革命性突破。该模型将每个参数限制为{-1,0,1}三值表示,通过创新的蒸馏感知训练策略,在仅使用29.8%内存的情况下达到与先进模型相当的性能。在LIBERO机器人基准测试中表现优异,为智能机器人在资源受限设备上的部署开辟了新路径,让家用机器人成为可能。
至顶网
科技行者 2025-06-12 08:10:09
高通AI研究院提出SwiftEdit:0.23秒闪电级图片编辑技术,彻底告别等待时代
高通AI研究院开发的SwiftEdit技术能够在0.23秒内完成复杂的图片编辑任务,比传统方法快50-500倍。该技术采用创新的"一步扩散"方法和两阶段训练策略,用户只需用自然语言描述即可实现精准编辑。实验显示SwiftEdit在保持超快速度的同时维持了良好的编辑质量,将彻底改变图片编辑的效率和易用性。
至顶网
科技行者 2026-03-06 15:09:48
新型存算分离架构技术展望
大数据存储解决方案一般有存算融合和存算分离两种部署形态。
至顶网
业界供稿 2022-11-29 17:08:10
TeleAI团队重磅发布TeleChat2、TeleChat2.5和T1:三款大语言模型的全面升级之路
TeleAI团队发布TeleChat2、TeleChat2.5和T1三款大语言模型的技术报告,详述了从10万亿tokens预训练到强化学习优化的完整开发过程。T1-115B在数学推理上超越OpenAI o1-mini,展现了国产AI模型的技术突破。研究采用4D并行训练策略,在8000个华为昇腾NPU上完成训练,并全面开源以促进AI技术发展。
至顶网
科技行者 2025-07-29 12:03:03
普林斯顿大学最新AI突破:小模型也能成为数学证明高手
普林斯顿大学研究团队开发了Goedel-Prover-V2,这是一个在自动数学定理证明领域取得重大突破的AI系统。该系统仅用8B参数就超越了6710亿参数的前代最强模型,在权威测试中达到84.6%成功率。其32B版本更是创下90.4%的新纪录。核心创新包括脚手架式数据合成、自我纠错机制和模型平均技术,证明了通过算法优化可以实现"小而精"胜过"大而全"的技术突破。
至顶网
科技行者 2025-08-08 13:00:59
ModernGBERT:德国语言的新标杆,维尔茨堡大学推出全透明1B参数编码器模型
这篇论文介绍了ModernGBERT,一个由维尔茨堡大学研究团队开发的高性能德语编码器模型家族(1.34亿和10亿参数版本)。研究将ModernBERT的创新架构应用于德语,同时通过LLM2Vec方法将德语解码器模型转换为编码器以进行对比研究。在SuperGLEBer和MTEB等基准测试中,ModernGBERT 10亿参数模型不仅超越了之前最先进的德语编码器,还在性能和参数效率方面优于转换后的编码器。研究团队还证明了更大模型能有效利用大规模单语语料库,为德语自然语言处理提供了全透明、高性能的资源。
至顶网
科技行者 2025-05-30 11:16:04
英伟达BLACKWELL系统如何“吃下”万亿级参数AI模型
可以看到,单纯将Hopper替换为Blackwell并不是最好的答案。根据英伟达方面的解释,只有在配合一系列正确举措之后,推理性能提升至30倍、推理功耗降低至1/25的结果才有可能实现。
至顶网
至顶网计算频道 2024-03-21 17:14:41
InternVL3:上海AI实验室联合多所顶尖院校打造的多模态AI大模型新突破
上海AI实验室联合清华大学等顶尖院校发布的InternVL3,通过原生多模态预训练突破了传统AI模型"先语言后视觉"的局限。该模型在MMMU基准测试中获得72.2分,超越所有开源模型,并引入变长视觉位置编码和混合偏好优化等创新技术,全面开源为AI社区贡献宝贵资源。
至顶网
科技行者 2025-07-17 11:39:31
代码验证能否做到既快又准?威斯康星大学破解大型语言模型编程任务的速度与精度平衡难题
威斯康星大学研究团队提出"生成-筛选-排序"策略,通过结合快速筛选器和智能奖励模型,在AI代码验证中实现了11.65倍速度提升,准确率仅下降8.33%。该方法先用弱验证器移除明显错误代码,再用神经网络模型精确排序,有效解决了传统方法在速度与准确性之间的两难选择,为实用化AI编程助手铺平了道路。
至顶网
科技行者 2025-06-19 17:00:12
Tiny QA Benchmark++:LLMOps持续评估的轻量级多语言基准测试套件
Tiny QA Benchmark++(TQB++)是一个超轻量级的大型语言模型(LLM)评估工具,由Comet ML公司的Vincent Koc开发。这套工具仅需几秒钟即可检测LLM系统中的关键故障,与大型基准测试形成鲜明对比。其核心是一个不到20KB的52个精心制作的英语问答集,非常适合快速CI/CD检查和提示工程。TQB++的主要创新在于提供了一个合成数据生成工具包,能够按需产生任何语言、领域或难度的微型基准测试,并预先构建了11种语言的测试包。
至顶网
科技行者 2025-05-23 07:40:18
<
上一页
1377
1378
1379
1380
1381
1382
1383
1384
1385
1386
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号