用了 0.101591秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容1228 条
  • FAMA:意大利和英语的首个大规模开源语音基础模型

    意大利布鲁诺·凯斯勒基金会研究团队发布FAMA,首个遵循开放科学原则的英意双语语音基础模型。与Whisper等闭源模型不同,FAMA完全开放训练数据、代码和模型权重,在超过15万小时开源语音数据上训练。研究创建了包含1.6万小时伪标注数据的新数据集,实验表明FAMA性能可与现有语音基础模型媲美,同时速度提升8倍。这一突破不仅促进研究可重复性和公平评估,还为语音技术领域树立了开放科学新标准。
    至顶网  科技行者  2025-06-04 10:13:04  
  • 大型语言模型也能"节食减肥":ISTA研究团队突破1位量化训练极限

    奥地利科学技术研究所开发的QuEST方法实现了大型语言模型在极低精度下的稳定训练突破。该方法通过哈达玛变换和信任梯度估计器,成功将量化训练的精度极限从8位推进到4位,甚至实现1位精度的稳定训练。实验显示4位QuEST模型在相同资源下超越16位传统模型,运行速度提升达2.4倍,为AI模型的高效部署提供了新解决方案。
    至顶网  科技行者  2025-08-21 16:40:53  
  • 大语言模型开始"学会偷懒"?清华上海AI实验室等揭秘智能推理效率新前沿

    这项由清华大学、上海AI实验室等顶级研究机构联合完成的研究,系统分析了当前大推理模型存在的"过度思考"问题,并提出了从推理过程、训练方法、强化学习到架构创新的全方位解决方案。研究发现AI模型经常对简单问题进行冗长推理,浪费大量计算资源,通过多种优化技术可显著提升推理效率,为AI技术的普及和产业化应用提供重要支撑。
    至顶网  科技行者  2025-07-31 09:56:18  
  • 哈佛大学团队突破性发现:AI如何像人类一样从少量例子中快速学会新技能

    哈佛大学和麻省理工学院研究团队开发了MetaFlows,一种革命性的AI学习方法,能让机器像人类一样从少量例子中快速学会新技能。该技术结合流匹配和元学习,显著提升数据效率,在图像生成和视频合成等任务中表现出色。MetaFlows有望在创意产业、教育医疗等领域广泛应用,虽然目前仍面临计算复杂度等挑战,但为通用人工智能发展开辟了新路径。
    至顶网  科技行者  2025-08-22 10:02:17  
  • 「底层」文科生和天坑专业人,正在争夺码农Offer

    「“转码”正在成为不那么好找工作的——文史哲、土木、建筑、“四大天坑”生化环材(生化、化学、环境、材料)等专业毕业生们的主动选择。今日推荐后浪研究所(id:youth36kr)一篇文章,程序员依然是高性价比的工作选择。」
    至顶网  至顶网码客人生频道  2022-09-20 10:35:42  
  • 生成式 AI 和大语言模型即将实现近乎无限内存带来的惊人可能性

    本文探讨了生成式 AI 和大语言模型 (LLMs) 即将实现的近乎无限记忆能力这一重大突破。通过新的架构设计,AI 系统将能够存储和检索几乎无限量的对话历史,实现持续性的上下文理解和个性化交互。这项技术将彻底改变 AI 的应用方式,但同时也带来了隐私保护等方面的挑战。
    至顶网  Forbes  2025-01-03 15:17:09  
  • 南京大学团队突破视频超分辨率技术:让模糊视频重获新生的神奇方法

    南京大学团队开发出STAR视频超分辨率技术,通过借用文本生成视频模型的智慧,配合局部信息增强模块和动态频率损失机制,成功解决了现实世界视频修复中的画质模糊和时间不连贯问题。该技术在多项测试中表现优异,特别是在处理人脸和文字等细节内容时效果显著,为珍贵但画质不佳的视频修复提供了全新解决方案。
    至顶网  科技行者  2025-09-17 13:29:10  
  • AI新手也能玩转超强推理:这个2.75B的小模型居然超越了8B大模型!

    Inclusion AI的Ring团队开发了Ring-lite,一个仅有2.75亿活跃参数却能匹敌8亿参数模型的推理AI。该模型采用专家混合架构和创新的C3PO训练方法,在数学竞赛、编程竞赛和科学推理等任务上表现优异,完全开源可免费使用。
    至顶网  科技行者  2025-06-23 11:46:36  
  • Adobe Research团队重新定义长视频生成:从5秒到5分钟的技术突破之路

    Adobe Research联合32家顶尖机构发布重磅研究,全面解析长视频生成技术现状与突破路径。研究发现当前AI视频生成存在时长限制(多数仅5-16秒)和质量衰减问题,通过分析六大技术流派和核心架构组件,为实现电影级长视频生成提供了系统性解决方案,预示着从几秒短片向几分钟完整故事视频的技术跃迁即将到来。
    至顶网  科技行者  2025-07-21 10:02:02  
  • 阿里巴巴Qwen团队首次提出P-GenRM:个性化大模型奖励机制的全新突破

    阿里巴巴Qwen团队提出全球首个个性化生成式奖励模型P-GenRM,通过三阶段训练和测试时用户导向扩展机制,实现AI系统对不同用户偏好的精准适应。该技术在标准测试中平均提升2.31%准确性,测试时扩展机制额外提升3%性能,为客服、教育、内容推荐等领域的个性化AI应用开辟新前景。
    至顶网  科技行者  2026-02-14 10:30:30  
  • 让AI像人类一样点击屏幕:耶鲁大学团队如何让电脑助手学会"看懂"桌面操作

    耶鲁大学研究团队开发出ANCHOR方法,通过"分支点扩展"策略解决AI桌面操作训练数据稀缺问题。该方法从高质量种子演示出发,在关键界面变化点创造任务变种,生成平均17.24步的长序列轨迹,配合多层质量控制确保数据可靠性。实验显示在两个主流测试平台上模型性能显著提升,为实用化桌面AI助手奠定基础。
    至顶网  科技行者  2026-02-11 15:58:53  
  • 上海交大研究团队让AI从过往经验中学习,代码修复准确率突破40%

    上海交大团队开发SWE-Exp系统,让AI能从过往代码修复经验中学习,通过构建"经验银行"存储成功和失败案例,采用双智能体协作模式实现智能修复。在基准测试中达到41.6%成功率,比之前最好方法提升7.2%,开创了从试错探索向经验驱动修复的新范式。
    至顶网  科技行者  2025-08-07 10:21:09  
  • 巴赫切希尔大学发现:智能目标检测模型在模糊噪音环境中的"视力"挑战

    巴赫切希尔大学研究团队通过对五种不同规模YOLO模型的量化鲁棒性测试发现,静态INT8量化虽能带来1.5-3.3倍速度提升,但会显著降低模型对噪音等图像损伤的抵抗能力。他们提出的混合校准策略仅在大型模型处理噪音时有限改善,揭示了效率与鲁棒性平衡的复杂挑战。
    至顶网  科技行者  2025-09-05 15:12:55  
  • Meta开发会说话的AI虚拟角色:从语音到电影级视频,一句话就能"变出"会对话的人物

    Meta联合滑铁卢大学开发的MoCha系统实现重大突破,仅需语音和文字描述就能生成电影级会说话的虚拟角色视频。该技术突破传统局限,无需参考图片等辅助条件,还能实现多角色对话场景,在唇音同步、表情自然度等方面显著超越现有方法,为内容创作、教育、娱乐等领域带来革命性变化。
    至顶网  科技行者  2025-07-17 09:29:33  
  • 复旦大学发布StrandDesigner:让画几笔线条就能生成逼真3D头发的人工智能系统

    复旦大学和腾讯优图实验室联合推出StrandDesigner系统,首次实现通过手绘草图自动生成逼真3D头发的突破。该技术采用可学习多尺度放大策略和自适应条件控制机制,能处理从简单涂鸦到专业草图的各种输入,在多项指标上显著超越现有方法,有望革新游戏、影视等数字内容创作流程。
    至顶网  科技行者  2025-08-12 14:16:02  
  • 为创意写作量身定制:Midjourney团队如何让AI写作变得更有趣更多样化

    这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
    至顶网  科技行者  2025-07-30 10:01:42  
  • 强化学习遇上变形金刚:田纳西理工大学发现AI自学的秘密

    田纳西理工大学研究团队通过结合强化学习和变形金刚架构,成功开发出具备"元学习"能力的AI系统。该系统能在未见过的环境中快速适应并持续改进,展现了900%的性能提升。研究证实AI可进行技能组合、适应环境变化,且对训练数据质量具有显著鲁棒性,为通用人工智能发展指明新方向。
    至顶网  科技行者  2025-09-15 09:18:18  
  • 香港科技大学突破性研究:视频预测AI如何像人类一样思考与推理

    香港科技大学研究团队开发了MOSS-ChatV视频AI系统,通过创新的"过程推理奖励"机制解决了现有视频AI推理过程不一致的问题。该系统不仅能准确预测视频中的未来事件,还能提供清晰的推理解释。研究构建了MOSS-Video数据集,采用动态时间规整算法训练模型,在多个视频理解任务上取得显著性能提升,为视频AI的可解释性发展开辟了新方向。
    至顶网  科技行者  2025-10-16 15:12:56  
  • 弗吉尼亚理工大学推出AR-RAG:让AI像拼图高手一样"边看边画"的革命性图像生成技术

    弗吉尼亚理工大学推出AR-RAG技术,让AI像拼图高手一样在生成图像时动态检索参考片段。该技术突破传统"闭门造车"模式,实现边生成边参考,显著提升图像质量和细节准确性。提供免训练DAiD和优化训练FAiD两种方案,在多个权威测试中创造同规模模型最佳成绩。
    至顶网  科技行者  2025-06-23 09:25:55  
  • VolSplat:浙江大学团队重新定义3D场景重建,像搭积木一样精准还原虚拟世界

    浙江大学等高校研究团队开发的VolSplat系统,通过"体素对齐"替代传统"像素对齐"方法,实现了快速高质量的3D场景重建。该技术仅需6张普通照片即可生成精确3D模型,在RealEstate10K等标准数据集上显著超越现有方法,为机器人导航、增强现实、建筑设计等领域提供了新的技术选择,代表了3D重建领域从二维思维向三维思维的重要转变。
    至顶网  科技行者  2025-10-14 10:05:12  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号