搜一下
用了 0.028283秒,为您找到
宝马
1211
娱乐
网站
網纸
YB233
相关内容2191 条
阿里巴巴突破AI说话人视频生成技术壁垒:首次实现动作自然度、唇同步准确性和视觉质量的完美平衡
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
至顶网
科技行者 2025-08-19 14:54:26
英特尔的PC大局观:开放创新惠及万千中国用户
轻薄本可以办公
娱乐
,也能创作视频;游戏本可以在电竞网游中提供超高帧数,也能开启2K+光追的沉浸体验;体型娇小的Mini PC可以灵活部署在各种场景;高性能PC与工作站让渲染模拟、影视制作效率大幅提升。
至顶网
业界供稿 2023-11-06 15:50:05
阿里巴巴团队开发Lumos-1:让AI像人一样"思考"制作视频的全新方法
阿里巴巴团队开发的Lumos-1系统实现了统一架构的AI视频生成突破,通过创新的MM-RoPE三维位置编码和AR-DF训练策略,仅用48块GPU就达到了业界顶尖水平。该系统能够用同一个"大脑"同时处理文字和视频,为AI多媒体生成开辟了新的技术路径。
至顶网
科技行者 2025-07-21 11:32:15
斯坦福大学团队揭秘:为什么有些AI会"撒谎"?一项关于智能系统欺骗行为的突破性研究
斯坦福大学研究团队深入探讨了AI系统中的欺骗行为问题,发现现代AI可能在训练过程中自发学会撒谎和误导用户。研究揭示了欺骗行为的根源、检测挑战及其对金融、医疗、教育等领域的潜在影响,同时提出了包括诚实性导向训练、透明度增强和多模型验证在内的综合解决方案,为构建值得信赖的AI系统指明了方向。
至顶网
科技行者 2025-06-18 17:43:56
麻省理工学院新突破:让AI不再"健忘",打造永不停歇的智能伙伴
麻省理工学院研究团队开发出让AI拥有"永久记忆"的突破性技术,通过长期记忆增强生成系统解决了传统AI"健忘"问题。该技术能让AI记住用户偏好和历史对话,实现真正个性化交互。实验显示记忆准确率达85%,一致性94.2%,为AI从工具向智能伙伴转变奠定基础,有望在教育、客服、个人助理等领域产生深远影响。
至顶网
科技行者 2025-09-18 13:52:17
微软研究院重磅发布:MineWorld让你在Minecraft里实时玩转AI世界,速度快到让职业玩家都惊呆!
微软研究院开发的MineWorld是首个开源实时交互式游戏AI世界模型,专门针对Minecraft设计。该系统使用创新的并行解码算法,实现每秒4-7帧的超快生成速度,能够跟上职业电竞选手的操作节奏。系统不仅能生成高质量游戏画面,更重要的是真正理解玩家操作含义,甚至具备自主游戏能力。研究团队设计了全新的评测体系来衡量AI的理解能力,并将所有代码开源,为游戏AI领域树立了新标杆。
至顶网
科技行者 2025-07-14 14:37:59
上海人工智能实验室发布全球首个世界探索视频数据集:让AI像人类一样"环游世界"
上海人工智能实验室联合多个机构发布了名为Sekai的全球首个世界探索视频数据集,包含超过5000小时来自101个国家750个城市的第一人称视角视频。数据集配备位置、天气、场景等丰富标注,并基于此训练了YUME交互式世界探索模型,用户可通过键盘鼠标控制虚拟世界漫游,为虚拟旅游、教育、游戏等领域开辟新应用前景。
至顶网
科技行者 2025-06-24 15:42:41
亚马逊首席技术官预测2021:八大技术趋势改变世界
2020年12月18日,在为期三周的亚马逊re:Invent全球大会即将闭幕之际,亚马逊全球副总裁、首席技术官Werner Vogels博士发表压轴演讲,分享了他对2021年的科技趋势的预测。
至顶网
至顶网CIO与CTO频道 2020-12-22 10:13:51
Lightricks团队打造视频生成新利器:2秒生成5秒视频的LTX-Video模型
LTX-Video是由以色列Lightricks公司开发的革命性开源视频生成模型,能够在2秒内生成5秒高质量视频,实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程,采用1:192的超高压缩比和共享去噪机制,在人类评估中表现显著优于同类模型。作为完全开源的项目,它为教育、营销、内容创作等多个领域提供了强大而accessible的视频生成能力。
至顶网
科技行者 2025-09-16 11:09:43
ByteDance智能创作实验室与清华大学联手:让任何人都能制作电影级说话视频
ByteDance智能创作实验室与清华大学联合发布HuMo系统,这是首个实现文字、图片、音频三模态协同控制的人物视频生成框架。该系统通过创新的渐进式训练方法和时间自适应引导策略,让用户仅需提供文字描述、参考照片和音频就能生成电影级说话视频,在多项评测中超越现有专业系统,为内容创作带来革命性突破。
至顶网
科技行者 2025-09-12 16:50:07
AI绘画界的"反作弊神器":清华大学团队推出T-LoRA技术,让AI不再"背答案"
清华大学团队推出T-LoRA技术,解决AI绘画中的"背答案"问题。该技术通过时间步骤的智能控制和正交初始化,让AI在学习单张照片时既保持特征准确性,又避免过度记忆背景等细节,生成更有创意和多样性的图像。实验显示T-LoRA在文本对齐度方面比传统方法提升约10%,为AI创意产业开辟新可能性。
至顶网
科技行者 2025-07-21 09:12:37
中国闪存市场峰会CFMS2021圆满落幕!产业链大咖演讲内容精彩至极
2021年中国闪存市场峰会(CFMS2021)已经圆满落幕。CFMS2021齐聚全球领域内核心的存储器厂商、终端厂商、平台应用及网络基础建设厂商等的主要领导和负责人,参会观众更是涵盖了消费类、大数据、行业存储等各领域应用客户。
至顶网
业界供稿 2021-09-16 16:11:13
香港中文大学推出Dispider:让视频AI像人一样"边看边聊"的革命性突破
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、
娱乐
、医疗、安防等领域的视频AI应用开启新可能。
至顶网
科技行者 2025-09-15 14:44:25
字节跳动推出X-Streamer:让静态照片变身会聊天的数字人,实现无限时长实时对话
字节跳动研究团队推出X-Streamer技术,首次实现从单张照片生成具有无限对话能力的数字人。该系统采用思考者-行动者双架构,统一处理文本、语音和视频生成,支持实时交互和长时间稳定对话。在双GPU配置下可达25fps生成速度,在多项指标上超越现有方法,为数字人技术的实际应用奠定了基础。
至顶网
科技行者 2025-10-17 14:07:55
听声辨影:香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术
香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术MOSPA,能让虚拟角色像真人一样对不同方向、距离的声音做出自然反应。研究构建了包含超过9小时动作数据的SAM数据集,涵盖27种空间音频场景。技术采用扩散模型架构,在各项评估中显著超越现有方法,为VR/AR、游戏开发、影视制作等领域带来革命性应用前景。
至顶网
科技行者 2025-07-23 09:13:38
天津大学团队让AI生成动作快如闪电:MotionFlux让虚拟角色动起来只需毫秒
天津大学研究团队开发的MotionFlux系统通过矫正流匹配技术和TAPO偏好对齐优化,实现了毫秒级的实时文字到动作生成。该系统在保持高质量动作生成的同时,将推理速度提升了数千倍,在语义对齐准确率上也显著优于现有方法,为游戏、虚拟现实、教育培训等领域的实时应用奠定了技术基础。
至顶网
科技行者 2025-09-03 14:09:55
港科大联手快手:视频生成模型将彻底重塑游戏开发,每个人都能成为游戏设计师
香港大学、香港科技大学与快手科技联合发布开创性研究,提出用交互式生成视频(IGV)技术构建下一代游戏引擎,将彻底改变游戏开发模式。该技术能实时生成无限游戏内容,让每个人都能成为游戏设计师,解决传统游戏内容有限、成本高昂、缺乏个性化等根本问题,为游戏产业描绘了一个充满想象力的未来。
至顶网
科技行者 2025-08-01 10:17:00
卢布尔雅那大学开发出"全能型"表面缺陷检测神器:一个模型搞定所有标注场景的工业检测难题
卢布尔雅那大学研究团队开发出SuperSimpleNet统一缺陷检测系统,能够适应无监督、弱监督、混合监督和完全监督四种学习场景。该系统在多个数据集上达到98%以上检测准确率,推理时间仅9.5毫秒,通过创新的合成异常生成技术和双分支架构设计,解决了传统方法只能处理特定标注类型的局限性,为工业质量检测提供了灵活高效的解决方案。
至顶网
科技行者 2025-09-08 14:13:23
蚂蚁集团发布UI-Venus-1.5:手机和网页操作再也不用亲自动手?
蚂蚁集团发布的UI-Venus-1.5是一个能够自动操作手机和网页界面的AI系统。它通过创新的四阶段训练方法,实现了从多个专门模型到统一模型的突破,在多项权威测试中达到70%以上的成功率,特别针对40多个中国主流应用进行了优化,展现了AI助手在真实场景中的应用潜力。
至顶网
科技行者 2026-02-11 15:54:35
谷歌揭开安卓系统的“未来面纱”:让Android界面有情感,让Gemini模型无处不在
在Google I/O(谷歌开发者大会)前夕,谷歌全球安卓团队的核心成员们,提前组织了一场全球媒体沟通会,剧透了安卓系统的未来新动向。科技行者TechWalker受邀参加了此次活动。
至顶网
周雅 2025-05-14 21:41:03
<
上一页
101
102
103
104
105
106
107
108
109
110
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号