搜一下
用了 0.026099秒,为您找到
mg
娱乐
公司
什么
網纸
YB233
相关内容2091 条
AI视频生成新突破:天工AI让你用几张照片就能拍出好莱坞大片
天工AI推出的SkyReels-A2视频生成系统实现了重大突破,能够将多张不相关照片智能组合成高质量视频。该技术采用双分支架构处理语义和空间信息,通过200万训练样本学习元素组合规律。在与商业模型的对比中表现出色,特别是在物体一致性和视觉质量方面领先。该系统已开源,为创意产业、教育培训、虚拟电商等领域带来革命性应用前景。
至顶网
科技行者 2025-07-14 09:49:31
创业者涌入AI战场,最先利用AI大模型赚到钱的人
AIGC淘金人。
至顶网
吴彤 2024-07-18 14:40:10
全景虚拟世界的"修补术":NVIDIA与台湾交大联手解决360度场景中物体消失的技术难题
台湾阳明交通大学与NVIDIA联合开发的AuraFusion360技术,首次实现了360度全景场景中物体完美移除和空缺自然填补。该技术通过深度感知识别、自适应深度扩散和智能纹理融合三大创新,解决了传统方法在多视角一致性方面的难题,为VR/AR、房地产、旅游等行业的360度内容制作提供了革命性工具。
至顶网
科技行者 2025-08-20 18:06:48
MIT实验室打造音频界"翻译官":一个模型搞定语音、音乐和环境声
这篇论文介绍了MIT开发的USAD技术,这是一种能够同时理解语音、音乐和环境声音的通用音频AI模型。通过创新的知识蒸馏方法,USAD在多个音频处理任务上都达到了接近专门模型的性能水平,为构建更智能的音频理解系统奠定了基础。该技术在智能助手、多媒体处理、教育等领域具有广阔的应用前景。
至顶网
科技行者 2025-06-27 16:59:36
微软让AI模型解码效率狂飙9倍:华丽变身"注意力侦探"的逻辑推理大脑
微软研究院联合多所知名高校开发出SeerAttention-R稀疏注意力框架,专门优化AI推理模型的长序列解码效率。该技术通过自蒸馏学习让AI学会智能筛选重要信息,在保持近乎无损推理准确性的同时,实现了高达9倍的计算加速。系统采用轻量级插件设计,无需重训原模型即可集成,为长文本AI推理应用的普及铺平道路。
至顶网
科技行者 2025-06-16 16:18:00
Sber AI团队突破视频生成瓶颈:让超高清视频制作快2.7倍的神奇算法
俄罗斯Sber AI团队开发出NABLA算法,通过邻域自适应块级注意力机制实现AI视频生成2.7倍加速。该算法采用三步优化:降维侦察、智能筛选和精确映射,动态识别重要注意力区域,在保持视频质量的同时大幅减少计算开销,为高效AI视频生成提供新解决方案。
至顶网
科技行者 2025-07-29 17:15:17
AGI万字长文(上) | 2023回顾与反思
2023年大众对AI的看法从怀疑到认可,AGI(通用人工智能)的发展迅速,大模型展现出惊人的想象力和取悦能力。应用层尚未出现独角兽,创业者面临官方技术迭代的挑战。
至顶网
AIGC开放社区 2024-03-14 15:04:20
对话高通孟樸:自研Oryon CPU背后,是移动计算边界的再定义
骁龙峰会2024期间,高通中国区董事长孟樸接受了科技行者等媒体的采访,话题围绕自研芯片架构的故事、端侧AI的逻辑、汽车业务的布局、高通在中国市场的发展格局等内容展开。
至顶网
周雅 2024-10-26 10:26:16
阿里达摩院VACE:一个模型搞定所有视频创作,从文字到视频再到精细编辑全包了
阿里达摩院推出VACE系统,这是首个能够统一处理文字转视频、视频编辑、遮罩编辑等12种视频任务的AI模型。通过创新的视频条件单元(VCU)和上下文适配器架构,VACE不仅能单独完成各类视频生成编辑任务,还支持任务组合创造出传统方法无法实现的效果,为视频创作提供了革命性的一站式解决方案。
至顶网
科技行者 2025-08-01 10:14:02
黄仁勋与扎克伯格做了一场关于Meta生成式AI未来的探讨(附对话实录)
英伟达CEO黄仁勋和Meta CEO马克·扎克伯格,在美国丹佛举行的第50届SIGGRAPH图形大会上进行了一场关于生成式AI的对话,并且他们还互赠了皮衣。
至顶网
王聪彬 2024-07-30 16:38:56
GLiClass:轻量级文本分类的全能新秀,从乌克兰基辅走向世界的AI突破
GLiClass是由乌克兰基辅Knowledgator工程
公司
开发的创新文本分类模型,基于GLiNER架构改进而成。该模型通过联合编码文本和标签,在单次前向传递中完成多标签分类,实现了准确性与效率的完美平衡。测试显示,GLiClass不仅在准确性上超越强基准模型5.5%,处理速度更是比传统交叉编码器快2.3-16倍,特别是在大标签集场景下优势明显。模型已开源并提供多个规模版本以适应不同应用需求。
至顶网
科技行者 2025-08-14 12:44:58
南开大学联合团队:让AI如厨师般巧妙搭配文字和图片,构建首个大规模多模态对话数据集
南开大学研究团队创建了InterSyn——首个大规模多模态对话数据集,包含180万单轮和5万多轮样本,覆盖3500个话题。通过创新的SEIR迭代优化方法,显著提升了AI生成文图结合内容的质量。同时开发的SynJudge评价工具能从四个维度评估文图协调性,与人类判断偏差仅5%。实验证明该方法在文图协调性上提升52.1%,为构建更智能的多模态AI系统奠定了基础。
至顶网
科技行者 2025-06-19 10:46:38
Adobe Research与德州大学联手破解AI视频生成新难题:让人工智能边做边学,告别错误累积
Adobe Research与德州大学联手开发"自我强迫"训练法,让AI在视频生成时边做边学,彻底解决传统方法中错误会越积越多的问题。这种创新训练方式实现了真正的实时视频生成,在单GPU上达到17帧每秒的处理速度和亚秒级延迟,为直播、游戏和实时交互应用开辟了全新可能性。研究团队还引入滚动键值缓存机制,实现了理论上无限长的视频生成能力。
至顶网
科技行者 2025-06-16 09:34:19
上海AI实验室的新突破:让你用键盘控制的虚拟世界探险家YUME
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互
娱乐
领域提供了全新的技术路径。
至顶网
科技行者 2025-07-28 15:33:14
FusionAudio-1.2M:当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究
香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的大规模数据集。实验表明,使用该数据集训练的AI模型在音频理解和检索任务上显著超越现有方法,为智能语音助手、自动驾驶等领域带来重要应用前景。
至顶网
科技行者 2025-06-11 07:48:46
英伟达联手斯坦福:一口气生成一分钟连贯视频,AI终于会讲故事了
英伟达与斯坦福等顶尖机构联合开发的TTT技术首次让AI学会"讲故事",能生成长达一分钟的连贯视频。该技术采用"边做边学"的创新方法,让AI在生成视频时持续优化记忆能力,在人类评估中比现有最佳方法领先34个Elo积分,展现出革命性的长视频生成能力。
至顶网
科技行者 2025-07-17 09:24:31
中科大团队打造"会呼吸会笑"的AI语音助手:让机器说话如人类般自然生动
香港中文大学(深圳)团队开发了NVSpeech系统,首次实现了对中文语音中笑声、叹息、呼吸等18种副语言声音的精确识别与合成。该系统构建了包含174,179条语音、总时长573.4小时的全球最大中文副语言数据集,让AI语音助手能够像人类一样"有声有色"地表达情感。
至顶网
科技行者 2025-08-15 08:25:19
《数字经济洞察周报》2023年第28期 | 苹果发布搭载3nm A17 Pro芯片的iPhone 15 Pro(附机型对比)
苹果发布搭载3nm A17 Pro芯片的iPhone 15 Pro(附机型对比)
至顶网
孙硕 2023-12-07 16:13:12
游戏世界也能"人工制造"?Skywork AI让你用键盘鼠标随心创造虚拟世界
Skywork AI推出Matrix-Game,这是首个能根据键盘鼠标操作实时生成交互式游戏世界的AI模型。该系统使用2700小时《我的世界》视频训练,拥有170亿参数,能精确响应用户指令生成符合物理规律的游戏场景。研究团队还开发了GameWorld Score评测标准,验证了Matrix-Game在控制精度和视觉质量方面显著超越现有模型,为AI辅助游戏开发和虚拟世界创建开辟了新方向。
至顶网
科技行者 2025-06-30 10:21:50
新加坡大学团队打造"影音同步魔法师":让机器像导演一样拍出声画完美合一的视频
新加坡国立大学团队突破音视频同步生成技术难题,开发出JavisDiT系统,能像专业导演一样确保声画完美同步。该系统采用创新的双向交叉注意力机制和分层时空先验估计器,在包含10,140个复杂场景样本的JavisBench数据集上全面超越现有方法,为音视频内容创作开辟新可能。
至顶网
科技行者 2025-07-15 11:36:57
<
上一页
99
100
101
102
103
104
105
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号