搜一下
用了 0.032065秒,为您找到
宝马
1211
娱乐
网站
網纸
YB233
相关内容2174 条
希伯来大学开发的免费AI导演:一句话变多幅电影级故事板
希伯来大学研究团队开发的Story2Board系统实现了从文字故事到专业故事板的自动转换突破。该系统采用潜在面板锚定和相互注意力数值混合两项核心技术,在保持角色一致性的同时实现丰富的视觉表现力。系统无需训练即可运行,能够生成电影级构图效果的连续画面,为内容创作、教育和
娱乐
产业提供了强大的AI辅助工具,代表了人机协作创作的新模式。
至顶网
科技行者 2025-10-10 10:32:06
阿里巴巴让声音"导演"电影场景:从一段音频到完整电影级视频的神奇魔法
阿里巴巴通义实验室开发的Wan-S2V系统实现了音频驱动电影级视频生成的重大突破。该140亿参数模型能仅凭音频创造复杂场景视频,包括多角色互动、动态摄像机运动等,远超传统"说话头像"技术。通过创新的文本-音频协同控制和长视频连贯性技术,在多项评估中显著优于现有竞品,为视频创作民主化开辟了新路径。
至顶网
科技行者 2025-09-02 16:02:54
研究报告:AIGC人工智能生产内容行业趋势分析
2022年下半年开始,“AIGC”接棒“元宇宙”成为全球关注的焦点和热议话题,各行各业都在积极探寻相关领域在AIGC助力下的崭新发展方向。
至顶网
至顶网计算频道 2022-11-29 16:20:33
腾讯混元团队推出P3-SAM:让AI像人一样精准拆解3D物体
腾讯混元团队推出P3-SAM系统,这是首个能够自动精确分割任意3D物体的AI模型。该系统采用原生3D处理方式,摆脱了传统方法对2D投影的依赖,在近370万个3D模型上训练而成。P3-SAM支持完全自动分割和交互式分割两种模式,在多个标准测试中达到领先性能,为游戏开发、工业设计等领域提供了强大的3D理解工具。
至顶网
科技行者 2025-09-19 11:08:24
当语音遇上表情:首个能同时生成说话和表情的AI模型问世
韩国研究团队开发出全球首个能够同时生成语音和面部表情的AI系统JAM-Flow,突破了传统技术分离处理音频和视觉的局限。该系统采用多模态扩散变换器架构,通过联合注意力机制实现音频与表情的完美协调。在多项测试中表现优异,用户体验测试显示其生成效果明显优于现有系统。这项技术为虚拟主播、影视制作、教育培训等领域带来革命性进展,代表了多模态AI发展的重要里程碑。
至顶网
科技行者 2025-07-04 10:19:59
从阿里辞职后不再内卷——一位德国程序员的“躺平”之路
如果你是因为幻想着新生活的美好而移民,那你将必然失望,因为生活中的盐总是咸的,哪里都一样。 如果你是因为要逃离旧世界的痛苦而移民,那你几乎一定会幸福,因为那一时一地的苦难并不是普世价值。
至顶网
尼酱 2022-06-16 16:27:56
电子科大团队最新发现:用不到10%的数据就能让AI更聪明,训练时间还能缩短一半!
电子科技大学研究团队突破性发现:仅使用不到10%的精选训练数据,就能让多模态AI的推理能力超越传统全数据训练方法,同时缩短40%训练时间。他们开发的RAP数据选择框架通过因果差异分析和注意力评估,精准识别能激发AI真正多模态推理的"认知样本",颠覆了"大数据必然更好"的传统观念,为AI训练开辟了质量优先的新路径。
至顶网
科技行者 2025-06-11 09:49:09
阿里巴巴突破AI说话人视频生成技术壁垒:首次实现动作自然度、唇同步准确性和视觉质量的完美平衡
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
至顶网
科技行者 2025-08-19 14:54:26
英特尔的PC大局观:开放创新惠及万千中国用户
轻薄本可以办公
娱乐
,也能创作视频;游戏本可以在电竞网游中提供超高帧数,也能开启2K+光追的沉浸体验;体型娇小的Mini PC可以灵活部署在各种场景;高性能PC与工作站让渲染模拟、影视制作效率大幅提升。
至顶网
业界供稿 2023-11-06 15:50:05
阿里巴巴团队开发Lumos-1:让AI像人一样"思考"制作视频的全新方法
阿里巴巴团队开发的Lumos-1系统实现了统一架构的AI视频生成突破,通过创新的MM-RoPE三维位置编码和AR-DF训练策略,仅用48块GPU就达到了业界顶尖水平。该系统能够用同一个"大脑"同时处理文字和视频,为AI多媒体生成开辟了新的技术路径。
至顶网
科技行者 2025-07-21 11:32:15
斯坦福大学团队揭秘:为什么有些AI会"撒谎"?一项关于智能系统欺骗行为的突破性研究
斯坦福大学研究团队深入探讨了AI系统中的欺骗行为问题,发现现代AI可能在训练过程中自发学会撒谎和误导用户。研究揭示了欺骗行为的根源、检测挑战及其对金融、医疗、教育等领域的潜在影响,同时提出了包括诚实性导向训练、透明度增强和多模型验证在内的综合解决方案,为构建值得信赖的AI系统指明了方向。
至顶网
科技行者 2025-06-18 17:43:56
麻省理工学院新突破:让AI不再"健忘",打造永不停歇的智能伙伴
麻省理工学院研究团队开发出让AI拥有"永久记忆"的突破性技术,通过长期记忆增强生成系统解决了传统AI"健忘"问题。该技术能让AI记住用户偏好和历史对话,实现真正个性化交互。实验显示记忆准确率达85%,一致性94.2%,为AI从工具向智能伙伴转变奠定基础,有望在教育、客服、个人助理等领域产生深远影响。
至顶网
科技行者 2025-09-18 13:52:17
微软研究院重磅发布:MineWorld让你在Minecraft里实时玩转AI世界,速度快到让职业玩家都惊呆!
微软研究院开发的MineWorld是首个开源实时交互式游戏AI世界模型,专门针对Minecraft设计。该系统使用创新的并行解码算法,实现每秒4-7帧的超快生成速度,能够跟上职业电竞选手的操作节奏。系统不仅能生成高质量游戏画面,更重要的是真正理解玩家操作含义,甚至具备自主游戏能力。研究团队设计了全新的评测体系来衡量AI的理解能力,并将所有代码开源,为游戏AI领域树立了新标杆。
至顶网
科技行者 2025-07-14 14:37:59
上海人工智能实验室发布全球首个世界探索视频数据集:让AI像人类一样"环游世界"
上海人工智能实验室联合多个机构发布了名为Sekai的全球首个世界探索视频数据集,包含超过5000小时来自101个国家750个城市的第一人称视角视频。数据集配备位置、天气、场景等丰富标注,并基于此训练了YUME交互式世界探索模型,用户可通过键盘鼠标控制虚拟世界漫游,为虚拟旅游、教育、游戏等领域开辟新应用前景。
至顶网
科技行者 2025-06-24 15:42:41
亚马逊首席技术官预测2021:八大技术趋势改变世界
2020年12月18日,在为期三周的亚马逊re:Invent全球大会即将闭幕之际,亚马逊全球副总裁、首席技术官Werner Vogels博士发表压轴演讲,分享了他对2021年的科技趋势的预测。
至顶网
至顶网CIO与CTO频道 2020-12-22 10:13:51
Lightricks团队打造视频生成新利器:2秒生成5秒视频的LTX-Video模型
LTX-Video是由以色列Lightricks公司开发的革命性开源视频生成模型,能够在2秒内生成5秒高质量视频,实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程,采用1:192的超高压缩比和共享去噪机制,在人类评估中表现显著优于同类模型。作为完全开源的项目,它为教育、营销、内容创作等多个领域提供了强大而accessible的视频生成能力。
至顶网
科技行者 2025-09-16 11:09:43
ByteDance智能创作实验室与清华大学联手:让任何人都能制作电影级说话视频
ByteDance智能创作实验室与清华大学联合发布HuMo系统,这是首个实现文字、图片、音频三模态协同控制的人物视频生成框架。该系统通过创新的渐进式训练方法和时间自适应引导策略,让用户仅需提供文字描述、参考照片和音频就能生成电影级说话视频,在多项评测中超越现有专业系统,为内容创作带来革命性突破。
至顶网
科技行者 2025-09-12 16:50:07
AI绘画界的"反作弊神器":清华大学团队推出T-LoRA技术,让AI不再"背答案"
清华大学团队推出T-LoRA技术,解决AI绘画中的"背答案"问题。该技术通过时间步骤的智能控制和正交初始化,让AI在学习单张照片时既保持特征准确性,又避免过度记忆背景等细节,生成更有创意和多样性的图像。实验显示T-LoRA在文本对齐度方面比传统方法提升约10%,为AI创意产业开辟新可能性。
至顶网
科技行者 2025-07-21 09:12:37
中国闪存市场峰会CFMS2021圆满落幕!产业链大咖演讲内容精彩至极
2021年中国闪存市场峰会(CFMS2021)已经圆满落幕。CFMS2021齐聚全球领域内核心的存储器厂商、终端厂商、平台应用及网络基础建设厂商等的主要领导和负责人,参会观众更是涵盖了消费类、大数据、行业存储等各领域应用客户。
至顶网
业界供稿 2021-09-16 16:11:13
香港中文大学推出Dispider:让视频AI像人一样"边看边聊"的革命性突破
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、
娱乐
、医疗、安防等领域的视频AI应用开启新可能。
至顶网
科技行者 2025-09-15 14:44:25
<
上一页
100
101
102
103
104
105
106
107
108
109
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号