搜一下
用了 0.025100秒,为您找到
mg
娱乐
公司
什么
網纸
YB233
相关内容2179 条
Lightricks团队打造视频生成新利器:2秒生成5秒视频的LTX-Video模型
LTX-Video是由以色列Lightricks
公司
开发的革命性开源视频生成模型,能够在2秒内生成5秒高质量视频,实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程,采用1:192的超高压缩比和共享去噪机制,在人类评估中表现显著优于同类模型。作为完全开源的项目,它为教育、营销、内容创作等多个领域提供了强大而accessible的视频生成能力。
至顶网
科技行者 2025-09-16 11:09:43
ByteDance智能创作实验室与清华大学联手:让任何人都能制作电影级说话视频
ByteDance智能创作实验室与清华大学联合发布HuMo系统,这是首个实现文字、图片、音频三模态协同控制的人物视频生成框架。该系统通过创新的渐进式训练方法和时间自适应引导策略,让用户仅需提供文字描述、参考照片和音频就能生成电影级说话视频,在多项评测中超越现有专业系统,为内容创作带来革命性突破。
至顶网
科技行者 2025-09-12 16:50:07
AI绘画界的"反作弊神器":清华大学团队推出T-LoRA技术,让AI不再"背答案"
清华大学团队推出T-LoRA技术,解决AI绘画中的"背答案"问题。该技术通过时间步骤的智能控制和正交初始化,让AI在学习单张照片时既保持特征准确性,又避免过度记忆背景等细节,生成更有创意和多样性的图像。实验显示T-LoRA在文本对齐度方面比传统方法提升约10%,为AI创意产业开辟新可能性。
至顶网
科技行者 2025-07-21 09:12:37
中国闪存市场峰会CFMS2021圆满落幕!产业链大咖演讲内容精彩至极
2021年中国闪存市场峰会(CFMS2021)已经圆满落幕。CFMS2021齐聚全球领域内核心的存储器厂商、终端厂商、平台应用及网络基础建设厂商等的主要领导和负责人,参会观众更是涵盖了消费类、大数据、行业存储等各领域应用客户。
至顶网
业界供稿 2021-09-16 16:11:13
香港中文大学推出Dispider:让视频AI像人一样"边看边聊"的革命性突破
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、
娱乐
、医疗、安防等领域的视频AI应用开启新可能。
至顶网
科技行者 2025-09-15 14:44:25
听声辨影:香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术
香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术MOSPA,能让虚拟角色像真人一样对不同方向、距离的声音做出自然反应。研究构建了包含超过9小时动作数据的SAM数据集,涵盖27种空间音频场景。技术采用扩散模型架构,在各项评估中显著超越现有方法,为VR/AR、游戏开发、影视制作等领域带来革命性应用前景。
至顶网
科技行者 2025-07-23 09:13:38
天津大学团队让AI生成动作快如闪电:MotionFlux让虚拟角色动起来只需毫秒
天津大学研究团队开发的MotionFlux系统通过矫正流匹配技术和TAPO偏好对齐优化,实现了毫秒级的实时文字到动作生成。该系统在保持高质量动作生成的同时,将推理速度提升了数千倍,在语义对齐准确率上也显著优于现有方法,为游戏、虚拟现实、教育培训等领域的实时应用奠定了技术基础。
至顶网
科技行者 2025-09-03 14:09:55
港科大联手快手:视频生成模型将彻底重塑游戏开发,每个人都能成为游戏设计师
香港大学、香港科技大学与快手科技联合发布开创性研究,提出用交互式生成视频(IGV)技术构建下一代游戏引擎,将彻底改变游戏开发模式。该技术能实时生成无限游戏内容,让每个人都能成为游戏设计师,解决传统游戏内容有限、成本高昂、缺乏个性化等根本问题,为游戏产业描绘了一个充满想象力的未来。
至顶网
科技行者 2025-08-01 10:17:00
卢布尔雅那大学开发出"全能型"表面缺陷检测神器:一个模型搞定所有标注场景的工业检测难题
卢布尔雅那大学研究团队开发出SuperSimpleNet统一缺陷检测系统,能够适应无监督、弱监督、混合监督和完全监督四种学习场景。该系统在多个数据集上达到98%以上检测准确率,推理时间仅9.5毫秒,通过创新的合成异常生成技术和双分支架构设计,解决了传统方法只能处理特定标注类型的局限性,为工业质量检测提供了灵活高效的解决方案。
至顶网
科技行者 2025-09-08 14:13:23
谷歌揭开安卓系统的“未来面纱”:让Android界面有情感,让Gemini模型无处不在
在Google I/O(谷歌开发者大会)前夕,谷歌全球安卓团队的核心成员们,提前组织了一场全球媒体沟通会,剧透了安卓系统的未来新动向。科技行者TechWalker受邀参加了此次活动。
至顶网
周雅 2025-05-14 21:41:03
CSDI:培养数字化复合型人才
9月16-18日,2022CSDI峰会帮助企业利用技术认知、AI、云计算、大数据等进行数字化重塑。
至顶网
业界供稿 2022-08-08 12:06:42
当照片"有洞有残缺"时,AI也能巧手补天:北京大学团队让3D重建告别"马赛克"困扰
GSFixer是由北京大学等机构联合开发的3D重建技术,专门解决从稀少照片中重建高质量3D模型的难题。该技术通过参考引导的视频扩散模型,融合2D语义和3D几何信息,确保生成的新视角与原始照片保持一致性。相比现有方法在图像质量和结构准确性方面都有显著提升,可广泛应用于文物保护、房地产、影视游戏等领域。
至顶网
科技行者 2025-08-18 13:58:33
拼多多2018财年营收131亿 黄峥致股东:做普惠电商
北京时间4月24日晚间,拼多多发布2018财年年报,披露该财年完整运营数据。2018年,拼多多平台年度活跃买家数达4.185亿,GMV达4716亿元,实现营收131.20亿元,各项核心数据维持三位数以上的同比增长。
至顶网
科技行者 2019-04-25 08:32:52
当AI观看视频后发现自己"偏心"了:韩国科学院团队揭示智能检索系统的隐性偏见
韩国科学院团队发现多模态大语言模型存在"候选项先验偏见",即系统偏爱高频出现的内容而非真正相关的内容。他们开发了BLiM双向检索框架和CPN标准化技术,通过让AI从两个方向思考问题并消除统计偏见,在四个数据集上平均提升6.4个百分点的检索准确率。该技术还适用于视觉问答、图像描述等多个领域,为构建更公平可靠的AI系统提供了新方案。
至顶网
科技行者 2025-08-08 13:05:37
斯坦福大学和字节跳动联手打造:让AI生成超长视频不再是梦想
斯坦福大学和字节跳动联合研究团队开发出混合上下文(MoC)技术,革命性地解决了AI长视频生成中的记忆与计算难题。该技术将视频生成重新定义为信息检索问题,通过智能选择最相关历史信息,实现了85%稀疏化率,计算效率提升7倍,生成速度提升2.2倍,能稳定生成分钟级高质量连贯视频,为视频创作民主化开辟新路径。
至顶网
科技行者 2025-09-04 09:59:17
南洋理工与得州农工团队重磅合作:打破4D空间重建瓶颈,为虚拟世界构建全新智能系统
新加坡南洋理工大学联合国际团队首次提出4D空间智能重建的五层级分类体系,从基础空间感知到物理规律融合,为从视频构建三维动态世界技术发展提供完整路线图,有望革命性改变虚拟现实、机器人和数字内容创作领域。
至顶网
科技行者 2025-08-05 10:33:35
没有空间智能,AI一定是不完整的,李飞飞最新访谈:语言在自然世界中并不存在,世界模型将让人类在多元宇宙中生活
李飞飞的World Labs以"空间智能"重新定义AI,专注3D物理世界理解,4个月估值飙至10亿美元,获科技巨头集体押注。她揭示语言无法编码物理世界,而DNA双螺旋等突破性发现都源于三维空间的深度认知。
至顶网
至顶AI实验室 2025-06-09 16:32:40
从印地语到英式口音,人工智能让语音生成告别"一口一个味"——孟买工程学院突破多语言情感语音合成
孟买工程学院研究团队开发出突破性的多语言情感语音合成系统,能实现印地语与英语间的实时口音切换,同时准确表达多种情感。该系统在口音准确性上提升23.7%,情感识别准确率达85.3%,为南亚地区教育技术和无障碍软件应用开辟新道路。
至顶网
科技行者 2025-06-25 14:54:05
我在MWC上海,看到5G-A和AI的融合开始具像化了
我们每个人,都将是这场价值革命的亲历者和受益者。
至顶网
周雅 2025-06-21 14:22:08
我在MWC上海,看到5G-A和AI的融合开始具像化了
我们每个人,都将是这场价值革命的亲历者和受益者。
至顶网
周雅 2025-06-21 14:25:28
<
上一页
101
102
103
104
105
106
107
108
109
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号