搜一下
用了 0.049132秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容3164 条
北京智源研究院发布史上最强双语预训练数据集:35TB的"神级数据库"让AI推理能力飞跃
这项由北京智源研究院完成的研究发布了CCI4.0数据集,包含35TB的中英双语预训练数据和45亿份思维链条模板。通过精密的五道数据处理工序和创新的思维过程合成技术,该数据集显著提升了AI模型的推理能力,在多项基准测试中表现优异,为AI训练数据的质量工程化树立了新标准。
至顶网
科技行者 2025-06-12 11:23:33
中科大团队打造"会呼吸会笑"的AI语音助手:让机器说话如人类般自然生动
香港中文大学(深圳)团队开发了NVSpeech系统,首次实现了对中文语音中笑声、叹息、呼吸等18种副语言声音的精确识别与合成。该系统构建了包含174,179条语音、总时长573.4小时的全球最大中文副语言数据集,让AI语音助手能够像人类一样"有声有色"地表达情感。
至顶网
科技行者 2025-08-15 08:25:19
MOLE:利用大语言模型从科学论文中提取和验证元数据的创新框架
MOLE是一个由KAUST研究团队开发的创新框架,利用大语言模型从科学论文中自动提取数据集元数据。与传统方法相比,MOLE能提取30多种不同元数据属性,支持多语言数据集,并提供严格的验证机制确保输出质量。研究测试了包括Gemini、GPT-4o等七种大模型,结果显示Gemini 2.5 Pro整体表现最佳。MOLE通过自动化元数据提取,使研究人员能更容易发现和使用适合的数据集,促进研究效率和科学开放性。
至顶网
科技行者 2025-05-30 09:42:55
Meta首次突破:AI注意力机制终于学会"一心多用",让计算机能同时关注多个线索
Meta公司FAIR实验室的研究团队提出了多令牌注意力机制,这是一种突破性的AI注意力计算方法。通过引入卷积操作,新机制让AI能够同时关注文本中的多个位置并协调整合信息,解决了传统注意力机制"一心一用"的根本局限。在大规模语言模型和长文本任务中,该技术显著提升了AI的信息检索和理解能力。
至顶网
科技行者 2025-07-15 11:34:47
探寻魔都“引力场”:AI创新者为何在这片土地集体找到归属感?
这两家公司,一个是向内拷问人性的AI先锋,一个是向外探索物理极限的AI长跑者,却都将事业锚点,落在漕河泾开发区时,一个题目浮现了:这片土地的科创引力从何而来?
至顶网
周雅 2025-07-24 16:29:03
德州农工大学开发的"模糊大脑"系统:用AI在网络安全竞赛中找出软件漏洞并自动修复
德州农工大学研究团队开发的FuzzingBrain系统,结合大语言模型和传统模糊测试技术,能够自动发现软件安全漏洞并生成修复补丁。在DARPA人工智能网络挑战赛中获得第四名,成功发现28个漏洞包括6个零日漏洞。系统采用大规模并行架构,实现了智能化的漏洞检测和修复流程,为网络安全防护提供了新的技术路径。
至顶网
科技行者 2025-09-25 14:39:30
特拉维夫大学重大突破:让AI"大脑"变得透明可读的新方法
这项由特拉维夫大学研究团队完成的突破性研究,开发出一种新方法来解析AI大脑的内部结构。通过半非负矩阵分解技术,研究人员成功识别出AI中负责不同概念的"知识组件",并发现这些组件呈现层次化组织结构。实验证明,这种方法不仅能准确检测概念,还能有效操控AI行为,为理解和控制AI系统提供了新的工具。
至顶网
科技行者 2025-06-18 17:44:29
普渡大学团队打造AI"红蓝对抗"系统:用空间时间探索揭秘编程助手的安全漏洞
普渡大学研究团队开发了ASTRA红队系统,通过"空间时间探索"方法系统测试AI编程助手安全性。与传统方法不同,ASTRA专注现实使用场景,通过构建领域知识图谱和分析AI推理过程发现漏洞。实验显示ASTRA比现有技术多发现11-66%安全问题,生成的测试用例可提升AI安全训练效果17%,为AI编程助手安全保障提供了重要工具。
至顶网
科技行者 2025-08-15 15:06:10
深度学习也能像人一样"看重点"?揭秘视觉AI如何学会聪明地观察世界
这项研究提出了"高效探测"方法,解决了掩码图像建模AI难以有效评估的问题。通过创新的多查询交叉注意力机制,该方法在减少90%参数的同时实现10倍速度提升,在七个基准测试中均超越传统方法。研究还发现注意力质量与分类性能的强相关性,生成可解释的注意力图谱,展现出优异的跨域适应性。团队承诺开源全部代码,推动技术普及应用。
至顶网
科技行者 2025-06-18 13:07:41
亚马逊研究团队推出BeepBank-500:让电子音效研究变得像搭积木一样简单
亚马逊首席科学家Mandip Goswami发布BeepBank-500开源数据集,包含300-500个参数化合成电子音效,专为听觉界面研究设计。该数据集提供完整的元数据标注、可重现的生成脚本和基准测试,音频采用CC0-1.0许可证完全开放,填补了电子音效研究领域缺乏标准化工具的空白,为心理声学和人机交互研究提供了便捷的实验材料。
至顶网
科技行者 2025-10-13 09:02:05
清华大学和智谱AI联手打造355B参数超级AI大脑:GLM-4.5如何在推理、编程和智能代理三个关键领域同时称王
清华大学和智谱AI联合发布GLM-4.5系列模型,这是首个在推理、编程和智能代理三大核心领域同时达到顶尖水平的开源AI模型。GLM-4.5拥有355B参数但仅激活32B,创新的混合推理模式能根据任务复杂度自动选择思考深度。该模型在12项基准测试中排名第三,智能代理任务排名第二,已完全开源供研究使用。
至顶网
科技行者 2025-08-13 10:57:51
把家里老设备组装成超级计算机:阿联酋研究团队让70B大模型在普通家庭设备上飞速运行
阿联酋和中国研究团队联合开发prima.cpp系统,成功实现70B大模型在普通家庭设备集群上运行。该系统通过创新的管道环形并行技术和Halda调度算法,将响应速度提升15倍至600毫秒,内存压力控制在6%以下,为AI技术民主化提供了新路径。
至顶网
科技行者 2025-07-17 09:28:40
ByteDance发布DreamVVT:让任何人都能在视频中"换衣服"的AI魔法师
DreamVVT是ByteDance团队开发的突破性AI视频虚拟试穿系统,采用创新的两阶段设计:先为关键帧生成精准试穿效果,再生成流畅完整视频。该系统能处理复杂的真实场景,包括户外环境、360度转身等高难度动作,在多项评测中达到最优性能。技术核心在于充分利用预训练模型优势,通过多模态信息融合实现高质量的服装替换效果。
至顶网
科技行者 2025-08-11 14:30:35
伊利诺伊大学团队突破手机视频重建难题:不需要额外传感器,仅凭摄像头就能完美还原动态场景
伊利诺伊大学团队开发出ROS-Cam系统,仅需普通RGB视频即可精确重建动态三维场景,无需激光雷达等额外传感器。该技术通过补丁式追踪过滤器、异常值感知优化和两阶段策略,在多个数据集上超越现有方法,处理速度提升2-12倍。这项突破有望让普通用户轻松创建专业级三维内容,在电商、教育、文化保护等领域具有广阔应用前景。
至顶网
科技行者 2025-10-09 12:20:08
InfiX.ai发布InfiAlign:用12%训练数据追平顶级AI模型,让机器"小体量大智慧"的数据精选秘籍
InfiX.ai和香港理工大学联合发布的InfiAlign框架,通过多维数据筛选和两阶段课程学习,仅用12%训练数据就达到顶级模型性能。该框架发现回答长度与问题难度正相关,创新性地用长度作为难度指标,结合多样性采样和质量过滤,实现了数据效率的巨大提升。在数学推理等任务中表现优异,为资源有限的机构提供了经济高效的AI模型训练方案。
至顶网
科技行者 2025-08-13 09:23:43
从视频学会折纸?ByteDance团队让AI首次通过看视频掌握复杂技能
这项由ByteDance Seed和北京交通大学联合完成的研究首次让AI真正学会从真实世界视频中掌握复杂长时技能。研究团队开发的VideoWorld 2系统通过创新的dLDM技术架构,成功分离了动作学习和外观建模,使AI能够像人类一样从观察中学习并在新环境中准确复现技能。在手工制作和机器人操作任务中,该系统展现了显著的性能提升和强大的跨域泛化能力,为构建更通用的AI学习系统开辟了新路径。
至顶网
科技行者 2026-02-11 15:58:40
微软沙特阿拉伯研究团队发布Kuwain 1.5B:用"语言注射"技术让英文AI秒懂阿拉伯语
沙特阿拉伯misraj.ai团队开发了Kuwain 1.5B,一个仅15亿参数的阿拉伯语-英语双语AI模型。他们创新性地提出"语言注射"技术,在英语模型基础上增加8个新层专门处理阿拉伯语,同时保持原有层冻结。通过扩展26000个阿拉伯语词汇和9:1的数据配比,实现了阿拉伯语性能8%提升,英语能力完全保持,训练成本降低70%。该方法可推广到其他语言,为多语言AI发展提供了高效经济的新路径。
至顶网
科技行者 2025-07-17 09:27:01
《数字经济洞察周报》2023年第22期 |第十四届夏季达沃斯论坛在天津召开
2023年新领军者年会在天津召开
至顶网
孙硕,吕敬儒 2023-06-30 17:11:13
台湾大学联合MediaTek和Nvidia突破性成果:让AI自己教自己说话识别,语音识别准确率提升55%
台湾大学联合MediaTek和Nvidia的研究团队开发了一种突破性的语音识别自我改进框架,无需大量人工标注数据即可显著提升AI语音识别准确率。该方法通过让AI生成伪标签训练语音合成系统,再用合成语音反向训练识别模型,形成自我强化循环。在台湾国语测试中,新模型Twister比原版Whisper错误率降低20-55%,数据效率提升10倍以上,为低资源语言AI应用提供了新路径。
至顶网
科技行者 2025-06-19 10:47:53
对话Rokid赵维奇:AR为什么是探索现实世界“副本”的最佳形态
作为中美连续创业者,赵维奇的创业之路非常宽泛,做过社交软件、做过游戏、做过面向极限运动的AR产品等。而现在,赵维奇作为Rokid全球开发者生态负责人,也参与负责Rokid多款软硬件产品设计与研发。他回忆说,最早加入Rokid是在实验室,开发Rokid第一代AR眼镜,相当于是一个小组在做内部创业的过程。
至顶网
周雅 2024-09-09 15:22:53
<
上一页
151
152
153
154
155
156
157
158
159
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号