搜一下
用了 0.121670秒,为您找到
bob
手机
在线
網纸
YB233
相关内容9432 条
阿里达摩院VACE:一个模型搞定所有视频创作,从文字到视频再到精细编辑全包了
阿里达摩院推出VACE系统,这是首个能够统一处理文字转视频、视频编辑、遮罩编辑等12种视频任务的AI模型。通过创新的视频条件单元(VCU)和上下文适配器架构,VACE不仅能单独完成各类视频生成编辑任务,还支持任务组合创造出传统方法无法实现的效果,为视频创作提供了革命性的一站式解决方案。
至顶网
科技行者 2025-08-01 10:14:02
RLDP:卢森堡大学让隐私保护AI训练的颠覆性突破——一种自学习的"智能管家"让数据安全与模型效果完美共存
卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化,创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练,能动态调整隐私保护策略,在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短,同时增强了抗隐私攻击能力,为敏感数据的AI应用开辟了新路径。
至顶网
科技行者 2025-10-11 14:33:14
机器人终于会"想"再"动"了——艾伦人工智能研究院的MolmoAct模型让机器人拥有空间推理能力
艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。
至顶网
科技行者 2025-08-14 10:29:17
清华大学和智谱AI联手打造355B参数超级AI大脑:GLM-4.5如何在推理、编程和智能代理三个关键领域同时称王
清华大学和智谱AI联合发布GLM-4.5系列模型,这是首个在推理、编程和智能代理三大核心领域同时达到顶尖水平的开源AI模型。GLM-4.5拥有355B参数但仅激活32B,创新的混合推理模式能根据任务复杂度自动选择思考深度。该模型在12项基准测试中排名第三,智能代理任务排名第二,已完全开源供研究使用。
至顶网
科技行者 2025-08-13 10:57:51
伊利诺伊大学新突破:让AI像搭积木一样改变照片中的物体位置
伊利诺伊大学研究团队开发出"生成式积木世界"系统,通过将照片分解成3D几何积木,让用户能够直观地编辑图像中物体的位置、大小和角度,同时保持原有质感。该技术突破了传统图像编辑在3D空间操作上的限制,为专业设计和普通用户提供了全新的创作工具。
至顶网
科技行者 2025-07-01 14:15:47
吴声年度演讲全文:新物种时代的场景战略
2021年8月15日,一年一度的“新物种爆炸·吴声商业方法发布2021”如约而至,以下为《吴声造物》梳理的演讲全文。
至顶网
业界供稿 2021-08-16 17:37:20
百万模型的失踪与重生:希伯来大学科学家如何绘制全球AI模型的完整地图
希伯来大学研究团队提出"模型地图集"概念,系统性解决AI领域模型管理混乱问题。当前150万公开模型中超过60%缺乏文档,研究者难以找到合适模型,造成重复训练和资源浪费。团队开发出绕过权重对称性难题的新方法,能够自动推断模型血统关系和功能属性,已在真实数据上达到80%以上准确率,为构建有序AI生态系统奠定基础。
至顶网
科技行者 2025-08-04 09:59:05
耶鲁大学团队发布SciArena:科学文献助手大比拼,人类专家投票选出最强AI
这项由耶鲁大学联合纽约大学和艾伦人工智能研究所完成的研究,首次构建了专门针对科学文献任务的AI评估平台SciArena。通过收集超过13000张来自102位真实科学家的投票,研究揭示了当前AI助手在科学文献理解方面的真实水平,同时指出了AI自动评估系统的显著局限性,为科学研究领域的AI应用提供了重要参考。
至顶网
科技行者 2025-07-03 14:00:07
复旦大学团队让机器人学会"速成版"人体姿态计算:从反复试错到一次搞定的神奇突破
复旦大学与上海人工智能实验室联合开发的Learnable SMPLify技术,将传统人体姿态计算的耗时从12秒缩短至0.06秒,实现200倍速度提升。该方法通过神经网络学习姿态转换规律,摒弃传统反复优化策略,采用时间序列数据构造、人体中心坐标标准化和残差学习等创新设计,在保持高精度的同时大幅提升计算效率,为VR、游戏制作、体育训练等领域提供实用解决方案。
至顶网
科技行者 2025-08-29 14:08:25
记忆力爆满的AI大脑终于找到了"忘记"的艺术——MIT等顶尖院校发现让AI聪明"遗忘"的秘密
MIT等顶尖院校研究团队发现AI处理长文本时存在"记忆过载"问题,提出OPRM溢出预防方法,通过"分而治之"策略让AI学会聪明遗忘,性能提升14%-51%。该方法类似智能图书管理员,先快速浏览所有相关内容,再专注分析最相关部分,避免了传统方法的记忆溢出困境,为实现更高效的长文本AI应用开辟新路径。
至顶网
科技行者 2025-07-09 09:40:27
这45个场景,正在被区块链抽筋扒皮…
在不少中国的投资人和合作伙伴们的眼中,这是个落地的好项目。其母公司AitherCO2,已经在欧洲和北美耕耘八年,通过节能改造,帮助2000个客户节省超过7亿美元的能源开支。
至顶网
业界供稿 2018-11-20 11:48:59
微软团队让AI聊天更快更省钱:SIGMA模型把计算机系统管理变成会说话的智能助手
微软团队开发的SIGMA是首个专为系统域任务设计的高效大语言模型,通过创新的DiffQKV注意力机制在保持性能的同时大幅提升推理效率,在长文本场景下速度提升达33.36%。该模型在系统管理任务上的表现全面超越GPT-4,为AI在专业技术领域的应用开辟了新路径。
至顶网
科技行者 2025-09-17 10:02:32
上海AI实验室的新突破:让你用键盘控制的虚拟世界探险家YUME
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
至顶网
科技行者 2025-07-28 15:33:14
从科幻到现实:复旦大学发布全球首个多模态统一奖励模型,让AI像人类评委一样判断图像和视频质量
复旦大学联合上海人工智能实验室发布的UnifiedReward是全球首个统一多模态奖励模型,能够同时评价图片和视频的生成与理解任务。该模型通过跨任务协同学习,在各项评测中都显著超越了专门的单任务模型,在图片理解任务上准确率提升近20个百分点。这项技术为AI评价体系带来革命性突破,将大大降低AI系统开发成本,提升各种视觉AI产品的整体质量。
至顶网
科技行者 2025-08-04 11:16:11
清华大学团队用异步强化学习让AI搜索智能突破十轮限制:每次能进行150万字的超长探索
清华大学研究团队开发的ASearcher系统通过全异步强化学习突破了AI搜索智能体的轮次限制,实现了超过40轮工具调用和15万字符生成的长视野搜索能力。该系统不仅设计了智能数据合成方法生成高质量训练样本,还在多个标准测试中显著超越现有开源方案,为AI搜索智能的发展提供了重要技术突破和开源贡献。
至顶网
科技行者 2025-10-10 09:32:25
让AI看懂视频因果关系:女王大学突破视频推理技术壁垒
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。
至顶网
科技行者 2025-07-09 15:45:45
香港中文大学团队让AI成为卡通制作神器:一张图加几笔线稿就能生成完整动画片
香港中文大学等机构联合研发的ToonComposer系统实现了动画制作的重大突破,仅需一张彩色图片和几张线稿草图即可自动生成完整卡通动画。该系统通过稀疏草图注入机制和空间低秩适配器技术,将传统的中间帧绘制和上色工作整合为统一的"后关键帧制作"阶段,大幅提升制作效率。实验显示其在视觉质量和动作连贯性等指标上显著超越现有方法,为动画产业的智能化发展开辟新路径。
至顶网
科技行者 2025-08-19 10:46:28
清华大学突破性发现:让AI像人类一样理解和表达情感的新方法
清华大学研究团队首次提出情感认知融合网络(ECFN),让AI能像人类一样理解和表达情感。该系统通过多层次情感处理架构,在情感识别准确率上比现有最佳系统提升32%,情感表达自然度提升45%。研究突破了传统AI情感理解的局限,实现了跨模态情感融合、动态情感追踪和个性化情感建模,为医疗、教育、客服等领域带来革命性应用前景。
至顶网
科技行者 2025-06-18 13:07:01
台湾大学联合MediaTek和Nvidia突破性成果:让AI自己教自己说话识别,语音识别准确率提升55%
台湾大学联合MediaTek和Nvidia的研究团队开发了一种突破性的语音识别自我改进框架,无需大量人工标注数据即可显著提升AI语音识别准确率。该方法通过让AI生成伪标签训练语音合成系统,再用合成语音反向训练识别模型,形成自我强化循环。在台湾国语测试中,新模型Twister比原版Whisper错误率降低20-55%,数据效率提升10倍以上,为低资源语言AI应用提供了新路径。
至顶网
科技行者 2025-06-19 10:47:53
Kwai快手推出Keye-VL模型:让AI真正看懂短视频的突破性技术
快手推出的Keye-VL是一个专门为短视频理解而设计的80亿参数AI模型,在视频内容理解、数学推理和多模态任务方面达到同类模型中的最高水平。该模型采用独创的五模式推理系统和四阶段训练策略,能自动判断任务难度并选择合适的思考方式,在快手自建的KC-MMBench短视频基准测试中大幅领先其他模型。
至顶网
科技行者 2025-07-04 17:19:51
<
上一页
464
465
466
467
468
469
470
471
472
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号