搜一下
用了 0.058163秒,为您找到
ku
娱乐
代理
網纸
YB233
相关内容4001 条
字节跳动推出X-Streamer:让静态照片变身会聊天的数字人,实现无限时长实时对话
字节跳动研究团队推出X-Streamer技术,首次实现从单张照片生成具有无限对话能力的数字人。该系统采用思考者-行动者双架构,统一处理文本、语音和视频生成,支持实时交互和长时间稳定对话。在双GPU配置下可达25fps生成速度,在多项指标上超越现有方法,为数字人技术的实际应用奠定了基础。
至顶网
科技行者 2025-10-17 14:07:55
听声辨影:香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术
香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术MOSPA,能让虚拟角色像真人一样对不同方向、距离的声音做出自然反应。研究构建了包含超过9小时动作数据的SAM数据集,涵盖27种空间音频场景。技术采用扩散模型架构,在各项评估中显著超越现有方法,为VR/AR、游戏开发、影视制作等领域带来革命性应用前景。
至顶网
科技行者 2025-07-23 09:13:38
港科大团队让AI注意力机制学会"挑重点":动态掩码稀疏注意力让大模型更聪明更高效
港科大团队提出的动态掩码稀疏注意力机制通过内容感知的动态掩码生成和位置感知的稀疏计算,让大语言模型学会智能分配注意力资源。该方法在保持完整信息的同时大幅降低计算复杂度,在长序列处理中实现10倍以上加速,并在多项基准测试中超越现有方法,为高效长文本处理提供了新的解决方案。
至顶网
科技行者 2025-08-07 11:11:38
慕尼黑大学团队让AI像蜂群一样自己造机器人军团:无需人工指导的全自动智能体生成技术
慕尼黑大学研究团队开发了SwarmAgentic技术,这是首个能够完全自主生成智能体系统的框架,无需人工预设模板。该技术借鉴蜂群智能原理,让AI系统自己决定需要什么角色、如何分工协作。在旅行规划等六项复杂任务测试中,SwarmAgentic表现优异,在旅行规划任务上比现有最佳方法提升261.8%,展现了全自动智能体系统设计的巨大潜力。
至顶网
科技行者 2025-06-24 15:48:32
港科大联手快手:视频生成模型将彻底重塑游戏开发,每个人都能成为游戏设计师
香港大学、香港科技大学与快手科技联合发布开创性研究,提出用交互式生成视频(IGV)技术构建下一代游戏引擎,将彻底改变游戏开发模式。该技术能实时生成无限游戏内容,让每个人都能成为游戏设计师,解决传统游戏内容有限、成本高昂、缺乏个性化等根本问题,为游戏产业描绘了一个充满想象力的未来。
至顶网
科技行者 2025-08-01 10:17:00
卢布尔雅那大学开发出"全能型"表面缺陷检测神器:一个模型搞定所有标注场景的工业检测难题
卢布尔雅那大学研究团队开发出SuperSimpleNet统一缺陷检测系统,能够适应无监督、弱监督、混合监督和完全监督四种学习场景。该系统在多个数据集上达到98%以上检测准确率,推理时间仅9.5毫秒,通过创新的合成异常生成技术和双分支架构设计,解决了传统方法只能处理特定标注类型的局限性,为工业质量检测提供了灵活高效的解决方案。
至顶网
科技行者 2025-09-08 14:13:23
当人工智能无处不在,2065年你的生活将是什么样子的?
机器人会拥有自我意识吗?它们是否应当拥有权利?它们是否需要负责?
至顶网
科技行者 2018-03-27 14:23:48
英伟达发布Q1财报,黄仁勋:有没有美国芯片,中国AI都会高速发展
英伟达2025Q1营收440亿美元创纪录,数据中心业务暴涨73%至390亿美元。黄仁勋直言:"中国是全球最大AI市场,出口管制只会让美国失去平台领导权。Blackwell架构推动推理性能提升30倍,微软已部署数万块GPU,AI工厂正成为各国数字基础设施核心。"
至顶网
至顶AI实验室 2025-05-30 15:30:50
CSDI:培养数字化复合型人才
9月16-18日,2022CSDI峰会帮助企业利用技术认知、AI、云计算、大数据等进行数字化重塑。
至顶网
业界供稿 2022-08-08 12:06:42
当照片"有洞有残缺"时,AI也能巧手补天:北京大学团队让3D重建告别"马赛克"困扰
GSFixer是由北京大学等机构联合开发的3D重建技术,专门解决从稀少照片中重建高质量3D模型的难题。该技术通过参考引导的视频扩散模型,融合2D语义和3D几何信息,确保生成的新视角与原始照片保持一致性。相比现有方法在图像质量和结构准确性方面都有显著提升,可广泛应用于文物保护、房地产、影视游戏等领域。
至顶网
科技行者 2025-08-18 13:58:33
当AI观看视频后发现自己"偏心"了:韩国科学院团队揭示智能检索系统的隐性偏见
韩国科学院团队发现多模态大语言模型存在"候选项先验偏见",即系统偏爱高频出现的内容而非真正相关的内容。他们开发了BLiM双向检索框架和CPN标准化技术,通过让AI从两个方向思考问题并消除统计偏见,在四个数据集上平均提升6.4个百分点的检索准确率。该技术还适用于视觉问答、图像描述等多个领域,为构建更公平可靠的AI系统提供了新方案。
至顶网
科技行者 2025-08-08 13:05:37
浙江大学团队发布OS Agents全景调研:让AI助手像钢铁侠贾维斯一样操控电脑手机
这项由浙江大学等多家机构联合完成的大规模调研首次系统性梳理了操作系统智能体这一前沿领域,全面分析了基于多模态大语言模型的AI助手如何像人类一样操作电脑手机。研究涵盖了技术架构、训练方法、评估体系和发展挑战,为实现类似贾维斯的智能数字助手提供了完整的技术路线图。
至顶网
科技行者 2025-08-13 14:35:46
斯坦福大学和字节跳动联手打造:让AI生成超长视频不再是梦想
斯坦福大学和字节跳动联合研究团队开发出混合上下文(MoC)技术,革命性地解决了AI长视频生成中的记忆与计算难题。该技术将视频生成重新定义为信息检索问题,通过智能选择最相关历史信息,实现了85%稀疏化率,计算效率提升7倍,生成速度提升2.2倍,能稳定生成分钟级高质量连贯视频,为视频创作民主化开辟新路径。
至顶网
科技行者 2025-09-04 09:59:17
物理世界如何实现AGI?前空中客车CTO红杉访谈:我们的愿景是让AI设计人类无法设计的系统,从星际飞船到戴森球
P1.AI创始人保罗·埃雷门科正用合成数据训练AI设计物理系统,从住宅冷却到星际飞船,突破工程AGI的终极瓶颈——数据稀缺。他的AI工程师Archie已能像人类一样处理多物理场任务,目标是让机器设计人类无法想象的复杂系统。
至顶网
至顶AI实验室 2025-06-03 10:17:15
没有空间智能,AI一定是不完整的,李飞飞最新访谈:语言在自然世界中并不存在,世界模型将让人类在多元宇宙中生活
李飞飞的World Labs以"空间智能"重新定义AI,专注3D物理世界理解,4个月估值飙至10亿美元,获科技巨头集体押注。她揭示语言无法编码物理世界,而DNA双螺旋等突破性发现都源于三维空间的深度认知。
至顶网
至顶AI实验室 2025-06-09 16:32:40
从印地语到英式口音,人工智能让语音生成告别"一口一个味"——孟买工程学院突破多语言情感语音合成
孟买工程学院研究团队开发出突破性的多语言情感语音合成系统,能实现印地语与英语间的实时口音切换,同时准确表达多种情感。该系统在口音准确性上提升23.7%,情感识别准确率达85.3%,为南亚地区教育技术和无障碍软件应用开辟新道路。
至顶网
科技行者 2025-06-25 14:54:05
我在MWC上海,看到5G-A和AI的融合开始具像化了
我们每个人,都将是这场价值革命的亲历者和受益者。
至顶网
周雅 2025-06-21 14:22:08
我在MWC上海,看到5G-A和AI的融合开始具像化了
我们每个人,都将是这场价值革命的亲历者和受益者。
至顶网
周雅 2025-06-21 14:25:28
AI学会"分区管理"思维:特拉维夫大学突破语言模型内部理解新方法
特拉维夫大学研究团队提出用"混合因子分析"方法重新理解AI语言模型的内部机制,发现AI思维呈现社区化结构而非简单线性排列。这种新方法将AI的激活空间分解为语义相关的区域中心和局部变化方向,在概念定位和行为控制任务上显著优于传统方法,为精确控制AI、个性化应用和提升AI可解释性开辟了新路径。
至顶网
科技行者 2026-02-12 13:33:11
AI也能看图学本事了!南开大学团队让机器像人一样举一反三
南开大学团队开发的VisualCloze系统通过"视觉上下文学习"实现了通用图像生成,让AI能够像人类一样通过观察几个例子就学会新的图像处理任务。该系统采用统一架构处理多种任务,在风格转换、图像编辑、条件生成等方面都表现出色,并具备处理训练时未见过任务的泛化能力。
至顶网
科技行者 2025-07-15 10:10:06
<
上一页
191
192
193
194
195
196
197
198
199
200
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号