搜一下
用了 0.022768秒,为您找到
ku
娱乐
代理
網纸
YB233
相关内容1939 条
实时交互视频生成新突破:字节跳动团队让AI生成视频快如闪电
字节跳动种子实验室推出突破性实时视频生成技术AAPT,实现24fps高清视频的实时生成与交互控制。该技术通过自回归对抗后训练,将传统多步生成压缩至单步完成,在H100 GPU上实现0.16秒超低延迟。支持长达60秒连续视频流生成,在姿态控制虚拟人和摄像机控制世界探索等应用中表现出色,为实时交互媒体内容创作开辟全新道路。
至顶网
科技行者 2025-06-17 09:47:31
《数字经济洞察周报》2023年第29期 | 全球人工智能治理倡议发布
全球人工智能治理倡议发布
至顶网
孙硕 2023-12-07 16:39:01
香港中大突破视频编辑难题:让你轻松掌控每一帧画面的神奇技术
这项来自香港中文大学的研究开发了名为"LoRA-Edit"的视频编辑技术,通过巧妙结合LoRA适应技术和遮罩机制,解决了传统视频编辑中编辑效果难以精确传播、背景容易被意外改变的问题。该技术让用户只需编辑第一帧画面,就能让编辑效果自然传播到整个视频,同时可通过参考图片进一步控制编辑外观,在多项对比测试中均超越现有先进方法。
至顶网
科技行者 2025-06-19 12:54:25
360 AI负责人梁志辉:AI搜索不是"缝合怪",2025是从游击队转向正规军的关键一年
AI刚出现的头两三年,大家都觉得AI会颠覆一切,可能需要用一些全新的标准来评价AI产品。但是经过一年多的发展,大家发现AI产品本质上还是产品,依然要用传统的产品指标来衡量,比如点击率、转化率、留存率等这些硬核指标。如果用户不喜欢你的产品,点击率自然就上不去;如果产品没有足够的黏性,日活跃用户(DAU)也就积累不起来。
至顶网
Super黄的念想 2025-01-14 11:04:06
创业者涌入AI战场,最先利用AI大模型赚到钱的人
AIGC淘金人。
至顶网
吴彤 2024-07-18 14:40:10
微软让AI模型解码效率狂飙9倍:华丽变身"注意力侦探"的逻辑推理大脑
微软研究院联合多所知名高校开发出SeerAttention-R稀疏注意力框架,专门优化AI推理模型的长序列解码效率。该技术通过自蒸馏学习让AI学会智能筛选重要信息,在保持近乎无损推理准确性的同时,实现了高达9倍的计算加速。系统采用轻量级插件设计,无需重训原模型即可集成,为长文本AI推理应用的普及铺平道路。
至顶网
科技行者 2025-06-16 16:18:00
AGI万字长文(上) | 2023回顾与反思
2023年大众对AI的看法从怀疑到认可,AGI(通用人工智能)的发展迅速,大模型展现出惊人的想象力和取悦能力。应用层尚未出现独角兽,创业者面临官方技术迭代的挑战。
至顶网
AIGC开放社区 2024-03-14 15:04:20
对话高通孟樸:自研Oryon CPU背后,是移动计算边界的再定义
骁龙峰会2024期间,高通中国区董事长孟樸接受了科技行者等媒体的采访,话题围绕自研芯片架构的故事、端侧AI的逻辑、汽车业务的布局、高通在中国市场的发展格局等内容展开。
至顶网
周雅 2024-10-26 10:26:16
黄仁勋与扎克伯格做了一场关于Meta生成式AI未来的探讨(附对话实录)
英伟达CEO黄仁勋和Meta CEO马克·扎克伯格,在美国丹佛举行的第50届SIGGRAPH图形大会上进行了一场关于生成式AI的对话,并且他们还互赠了皮衣。
至顶网
王聪彬 2024-07-30 16:38:56
南开大学联合团队:让AI如厨师般巧妙搭配文字和图片,构建首个大规模多模态对话数据集
南开大学研究团队创建了InterSyn——首个大规模多模态对话数据集,包含180万单轮和5万多轮样本,覆盖3500个话题。通过创新的SEIR迭代优化方法,显著提升了AI生成文图结合内容的质量。同时开发的SynJudge评价工具能从四个维度评估文图协调性,与人类判断偏差仅5%。实验证明该方法在文图协调性上提升52.1%,为构建更智能的多模态AI系统奠定了基础。
至顶网
科技行者 2025-06-19 10:46:38
Adobe Research与德州大学联手破解AI视频生成新难题:让人工智能边做边学,告别错误累积
Adobe Research与德州大学联手开发"自我强迫"训练法,让AI在视频生成时边做边学,彻底解决传统方法中错误会越积越多的问题。这种创新训练方式实现了真正的实时视频生成,在单GPU上达到17帧每秒的处理速度和亚秒级延迟,为直播、游戏和实时交互应用开辟了全新可能性。研究团队还引入滚动键值缓存机制,实现了理论上无限长的视频生成能力。
至顶网
科技行者 2025-06-16 09:34:19
FusionAudio-1.2M:当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究
香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的大规模数据集。实验表明,使用该数据集训练的AI模型在音频理解和检索任务上显著超越现有方法,为智能语音助手、自动驾驶等领域带来重要应用前景。
至顶网
科技行者 2025-06-11 07:48:46
《数字经济洞察周报》2023年第28期 | 苹果发布搭载3nm A17 Pro芯片的iPhone 15 Pro(附机型对比)
苹果发布搭载3nm A17 Pro芯片的iPhone 15 Pro(附机型对比)
至顶网
孙硕 2023-12-07 16:13:12
华为徐直军:基于软件是云的核心实现对华为云的组织调整
实体清单让华为正在进行成立以来最大规模的战略转型——强化软件能力。基于软件是云的核心实现对华为云的组织调整。
至顶网
任新勃 2021-04-13 05:08:55
CES 2020前瞻:一份最全的趋势预测报告
科技行者将亲临现场,从当地时间1月5日开始为大家带来第一手报道。这里,我们梳理了一份CES2020上即将出现的最值得期待的消费级电子产品,一份万字长文的趋势预测报告。
至顶网
周雅 2020-01-04 01:12:55
谷歌DeepMind突破性技术:机器人能像人类一样"看着学"——从不完美数据中重建完美虚拟世界
谷歌DeepMind研究团队开发了一种革命性的机器人3D重建技术SplatMesh,能够让机器人从不完美的真实数据中学习,同时重建物体几何形状和外观。该技术采用端到端优化策略,将机器人校准、场景重建和物理仿真统一在一个框架中,在ALOHA2双臂机器人上的实验证明其能够处理现实世界的复杂条件,为机器人自主学习和适应提供了新的解决方案。
至顶网
科技行者 2025-06-11 09:49:23
KAIST团队突破性创新:让AI视频生成像调色师一样精确控制每一帧画面
韩国KAIST团队开发出革命性的"Frame Guidance"技术,这是首个无需训练即可精确控制AI视频生成的通用方法。该技术通过创新的潜在切片和视频潜在优化策略,将内存使用量减少60倍,让普通用户也能精确控制视频中任意帧的内容。实验表明,该方法在关键帧引导、风格化生成等任务上全面超越现有技术,为AI视频创作开启了全新可能。
至顶网
科技行者 2025-06-16 09:36:15
加拿大多伦多大学发布突破性研究:3D模型压缩新技术让海量数据瞬间变"迷你"
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
至顶网
科技行者 2025-06-13 15:42:27
中国十二大互联网公司 2022 年盘点:和过去的自己告别
「 2022年,中国的互联网行业集体进入新阶段。很多过去 “先试试、盈利暂不考虑” 的创新亏损业务在今年大多停下。也有一些公司的主营业务在国内的扩张空间有限,它们选择把钱投向了海外,以寻求新的增量。今日推荐 晚点LatePost(id:postlate)一篇文章」
至顶网
至顶网码客人生频道 2022-12-30 10:46:58
<
上一页
92
93
94
95
96
97
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号