搜一下
用了 0.073160秒,为您找到
彩神
APP
官方
最高
代理
内部
邀请
码罔芷
YB266CN
驻测
相关内容5719 条
AI路由器的革新:让机器根据你的喜好来选择最适合的AI大模型
Katanemo Labs公司研究团队开发了Arch-Router,一个15亿参数的AI路由器,能根据用户偏好智能选择最合适的AI模型。该系统采用"领域-动作"分类框架,在多项测试中超越GPT-4等大型模型7.71%,响应速度快28倍。研究证明了专业化小模型在特定任务上可超越通用大模型,为AI行业发展指出新方向。
至顶网
科技行者 2025-07-01 09:55:04
上海AI实验室的新突破:让你用键盘控制的虚拟世界探险家YUME
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
至顶网
科技行者 2025-07-28 15:33:14
JAM音乐生成器:新加坡科技设计大学让电脑学会作词谱曲,词曲同步精准到每个字
新加坡科技设计大学研究团队开发了JAM音乐生成系统,能够根据歌词生成完整歌曲,并实现词级精确时间控制。该系统仅用5.3亿参数就超越了参数量更大的同类系统,在歌词准确性、音乐质量等方面表现优异。通过创新的流匹配技术和审美对齐机制,JAM为AI音乐创作提供了新的技术路径。
至顶网
科技行者 2025-08-04 13:34:24
蒙彼利埃大学团队破解AI视觉模型"看错重点"难题:让机器真正学会专注于正确区域
这项由法国蒙彼利埃大学团队开发的iFAM系统,通过创新的两阶段设计解决了AI视觉模型"看错重点"的问题。系统第一阶段识别图像中的关键区域,第二阶段只处理被选中的区域,完全屏蔽背景干扰。在多个挑战性数据集上的实验表明,该方法显著提升了模型对虚假关联的抗性,为医疗诊断、自动驾驶等高风险应用提供了更可靠的技术基础。
至顶网
科技行者 2025-06-19 10:47:20
FusionAudio-1.2M:当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究
香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的大规模数据集。实验表明,使用该数据集训练的AI模型在音频理解和检索任务上显著超越现有方法,为智能语音助手、自动驾驶等领域带来重要应用前景。
至顶网
科技行者 2025-06-11 07:48:46
Iwin Transformer:上海交通大学提出的无位置编码视觉变换器,让AI看图更聪明
上海交通大学研究团队提出Iwin Transformer,这是一种无位置编码的分层视觉变换器,通过创新的交错窗口注意力和深度可分离卷积协作,能直接从低分辨率微调到高分辨率。该方法用注意力连接远程令牌,用卷积连接邻近令牌,在单模块内实现全局信息交换,克服了Swin Transformer需要两个连续块的局限。在ImageNet-1K上达到87.4%准确率,在语义分割和视频识别等任务中表现出色。
至顶网
科技行者 2025-07-29 17:16:23
从OpenAI出走,到成为AI独角兽:Anthropic诞生的完整故事,以及5条“经验之谈”
本文讲述了几个创始人从OpenAI出走,带着一套“AI必须讲道德”的理念,创立了Anthropic这家公司,并培养了(他们说的)“AI界最正直的公民”Claude。
至顶网
周雅 2025-04-09 21:37:28
SCB集团团队突破传统RAG技术壁垒:打造超大规模网络知识库的高速检索新方案
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
至顶网
科技行者 2025-06-20 14:18:38
复杂场景下的AI视觉难题:清华、牛津联合发布史上最困难的视频分割挑战MOSEv2
复旦大学联合牛津大学等机构发布MOSEv2数据集,这是目前最具挑战性的视频目标分割基准。数据集包含5024个复杂场景视频,涵盖恶劣天气、密集人群、目标消失重现等真实世界挑战。测试结果显示,包括SAM2在内的先进AI模型性能大幅下降,从理想数据集的90%+准确率降至50%左右,揭示了AI技术与实际应用需求的巨大差距。
至顶网
科技行者 2025-08-12 14:15:25
特拉维夫大学重大突破:让AI"大脑"变得透明可读的新方法
这项由特拉维夫大学研究团队完成的突破性研究,开发出一种新方法来解析AI大脑的
内部
结构。通过半非负矩阵分解技术,研究人员成功识别出AI中负责不同概念的"知识组件",并发现这些组件呈现层次化组织结构。实验证明,这种方法不仅能准确检测概念,还能有效操控AI行为,为理解和控制AI系统提供了新的工具。
至顶网
科技行者 2025-06-18 17:44:29
万字指南 | 当SaaS出海“回到”美国,那些共识与非共识背后的观察与思考
以美国为主的北美市场通常是软件及科技创业者迈向全球的第一步,这里不仅诞生了许多具备产品创新和技术特色的 SaaS 及软件公司,而且在生成式 AI 从硅谷席卷全球的这两年,软件产业也最先被“渗透”,甚至最近有人大呼:“AI 已来,SaaS 将死?”
至顶网
Linkloud 2024-10-17 14:04:30
NVIDIA发布Cosmos-Reason1:让AI拥有物理常识和身体推理能力的突破性研究
NVIDIA团队开发的Cosmos-Reason1是首个专门针对物理推理的多模态AI系统,通过创新的训练方法让AI具备了理解物理世界和进行具身推理的能力。该系统包含70亿和560亿参数两个版本,采用物理AI监督微调和强化学习两阶段训练,在物理常识和具身推理评测中显著超越现有模型,为机器人、自动驾驶等应用奠定重要技术基础。
至顶网
科技行者 2025-07-31 11:28:01
北航团队发明"神奇修改器":让3D模型编辑如同PS照片一样简单
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
至顶网
科技行者 2025-09-02 16:04:43
新加坡大学团队打造"影音同步魔法师":让机器像导演一样拍出声画完美合一的视频
新加坡国立大学团队突破音视频同步生成技术难题,开发出JavisDiT系统,能像专业导演一样确保声画完美同步。该系统采用创新的双向交叉注意力机制和分层时空先验估计器,在包含10,140个复杂场景样本的JavisBench数据集上全面超越现有方法,为音视频内容创作开辟新可能。
至顶网
科技行者 2025-07-15 11:36:57
蒙特利尔大学团队用AI"强化学习"让图像编辑变得像聊天一样简单
蒙特利尔大学研究团队开发出EARL图像编辑系统,通过强化学习训练让AI能够理解自然语言指令并完成复杂图像编辑。该系统采用"教练式"训练方法,AI在智能评价系统指导下持续改进编辑能力,最终在综合测试中以4.80分超越了包括商业系统Omnigen在内的所有对比方法。EARL不仅能处理简单的颜色修改,还能完成空间关系调整、数量变化等复杂任务,代表了人机交互方式的重要变革,有望让图像编辑变得像聊天一样简单。
至顶网
科技行者 2025-08-11 09:57:30
AI奖励模型也能"临时抱佛脚"?DeepSeek团队发现让AI在推理时多动脑筋,效果竟比增加训练数据更好
DeepSeek团队联合清华大学开发了一种革命性的AI评判方法——自主原则批评调优(SPCT),该方法让AI在推理时"多动脑筋",通过制定评判原则并进行多角度分析来提升评判准确性。研究发现,这种"慢思考"方式的效果竟然比简单增加模型规模更好,在多个评测基准上都取得了显著性能提升,为AI发展提供了新的技术路径。
至顶网
科技行者 2025-07-15 11:35:24
上海交通大学发布突破性科学推理数据集:让AI像人类一样思考科学问题
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越
官方
版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
至顶网
科技行者 2025-07-27 12:11:47
哈工大团队让机器人学会"聪明偷懒":像人脑一样高效处理复杂指令
哈工大研究团队开发的CogVLA系统通过模仿人脑认知机制,让机器人学会"智能筛选"信息,根据任务指令只关注重要内容。该系统采用三阶段渐进式处理架构,在LIBERO基准测试中达到97.4%成功率,同时训练成本降低2.5倍,推理速度提升2.8倍,为机器人技术的实用化和普及化奠定了重要基础。
至顶网
科技行者 2025-09-04 14:31:44
当AI成为隐私保护神:德州大学团队让大语言模型变身个人信息清理专家
德州大学研究团队开发的PRvL系统成功将大语言模型应用于个人信息保护,实现了99.4%的识别准确率和极低的隐私泄露风险。该系统支持多种模型架构和训练策略,具备跨语言处理能力,完全开源可本地部署,为医疗、法律、金融等敏感领域提供了实用的隐私保护解决方案。
至顶网
科技行者 2025-08-12 14:17:00
视频生成AI的"读心术":VBench-2.0如何测试AI是否真的理解我们的世界
这项由上海人工智能实验室等多家机构联合开展的研究,开发了VBench-2.0评估系统,专门测试视频生成AI对真实世界的理解能力。与关注视觉效果的传统评估不同,VBench-2.0从人体逼真度、可控性、创造力、物理学和常识推理五个维度,全面检验AI是否真正理解物理规律和逻辑关系,为视频生成技术发展提供了新的评估标准。
至顶网
科技行者 2025-07-30 09:58:27
<
上一页
280
281
282
283
284
285
286
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号