搜一下
用了 0.130761秒,为您找到
bob
什么
意思
網纸
YB233
相关内容9785 条
TalkingMachines:Character AI打造的实时音频驱动视频会话系统,让虚拟形象自然对话成为现实
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
至顶网
科技行者 2025-06-07 17:02:35
模型合并:一项提升大型语言模型预训练效果的强大武器——字节跳动Seed团队最新研究成果解析
这篇研究探讨了模型合并技术在大型语言模型预训练中的应用。字节跳动Seed团队通过从百万到千亿参数级别的系统实验证明,在稳定训练阶段合并检查点不仅显著提升模型性能,还能准确预测学习率衰减效果,大大节省计算资源。研究提出的PMA策略使恒定学习率训练后通过简单合并就能获得相当于完成衰减训练的效果。此外,他们还发现该技术能有效提高训练稳定性,避免训练崩溃。通过全面实验分析,研究为开源社区提供了实用的预训练模型合并指南。
至顶网
科技行者 2025-05-23 15:20:59
山林宇宙,共契往之:“我们在创造RPA的中国范式”|对话云扩科技CTO史秋芳
自研智能RPA平台,创建国内最大的RPA社区,手握全球一线投资机构数亿融资,云扩科技要如何创造RPA产业的中国范式。
至顶网
周雅 2021-11-08 13:25:35
阿里云团队突破传统:金融AI如何学会像专家一样思考
阿里云团队开发了Fin-PRM,一个专门针对金融推理的AI评判系统。该系统采用双重评判机制,既检查推理步骤准确性又评估整体合理性,并具备专业知识验证功能。通过3000个高质量样本训练,在三大应用场景中显示出显著性能提升:数据筛选提升12.9%,测试选择提升5.1%,强化学习提升5.2%,为金融AI的专业化发展提供了重要技术支撑。
至顶网
科技行者 2025-08-28 14:52:43
中国AIGC产业峰会:大模型引领应用新范式,微软阿里商汤揭秘新进展
聚焦AIGC应用落地难题,十余位产学研投代表共议新趋势。
至顶网
业界供稿 2024-04-18 10:17:13
百度CTO王海峰CNCC2019解读:深度学习如何大规模产业化?
10月17日-19日,2019年中国计算机大会(CNCC2019)在苏州举办,本届大会以“智能+引领社会发展”为主题,1000家机构的代表、8000余人参展参会。百度首席技术官王海峰在会上发表题为《深度学习平台支撑产业智能化》的演讲。
至顶网
业界供稿 2019-10-21 10:35:40
谷歌发布Learn-by-interact:让AI智能体像小孩学走路一样自我进化的突破性方法
谷歌和香港大学研究团队提出Learn-by-interact框架,让AI智能体通过自主与环境互动来学习,核心创新是"逆向构建"机制,能将失败操作转化为有价值训练数据。在四个真实环境测试中,该方法显著提升了AI在软件编程、网页操作、桌面应用等复杂任务中的表现,为构建实用AI助手开辟新路径。
至顶网
科技行者 2025-09-12 19:47:54
医生的AI助手:CRISP-SAM2如何让CT扫描精准识别人体器官
杭州电子科技大学研究团队开发出CRISP-SAM2智能医学影像分析系统,能够结合文字描述和CT图像同时进行器官识别。该系统通过跨模态语义交互技术,无需医生手动提示即可精准分割18种人体器官,在七个数据集测试中表现优异,为医学影像诊断提供了新的AI解决方案。
至顶网
科技行者 2025-07-07 12:16:40
2018增材制造全球创新大赛华中赛区武汉论坛圆满举办
9月7日,“三维世界的绽放”——「2018增材制造全球创新大赛华中赛区武汉论坛」在武汉市洪山区创意天地精彩亮相。
至顶网
科技行者 2018-09-11 10:57:45
IBM出版新书,介绍大量量子用例
IBM商业价值研究院(IBV)最新出版的第四版《量子十年(The Quantum Decade)》装帧精美、值得一读,相信会成为每一位高管人士的重要知识补充。
至顶网
至顶网计算频道 2024-03-18 10:25:17
效率大提升!华盛顿大学和新加坡国立大学联合研究突破视觉自回归模型内存瓶颈
这项由华盛顿大学和新加坡国立大学研究团队提出的ScaleKV技术,针对视觉自回归模型中的内存瓶颈问题提供了创新解决方案。研究发现不同变压器层具有不同的缓存需求,将它们分为需要大量历史信息的"起草者"和专注于当前细节的"精细器",实现了尺度感知的KV缓存分配。实验表明,该方法能将Infinity-8B模型的内存需求从85GB减少到8.5GB,同时保持生成质量几乎不变,为高分辨率AI图像生成的普及应用铺平了道路。
至顶网
科技行者 2025-05-29 15:56:32
IBM Granite 3.0模型:为大规模企业AI应用指明方向
IBM在企业AI领域做出了一系列颇为独特的探索。蓝色巨人目前正在推动全栈技术布局,以自2020年来兴起的AI和混合云作为企业战略领域的两大基础性支柱,同时借鉴了自身在其产品组合中积累下的优势。
至顶网
至顶网软件与服务频道 2024-11-06 13:48:48
从“用数据说话”到“让数据说话”,全面数据服务焕发酒店生意新生!
作为数据密集型行业,酒店业数据的应用已经渗透到了行业的各个环节。
至顶网
至顶网CIO与CTO频道 2024-01-10 11:03:03
解码人工智能根技术
十四五”时期人工智能规划需要关注的重点就是如何通过明确我国人工智能技术发展路线,发挥我国制度优势,促进人工智能根技术突破和创新
至顶网
业界供稿 2021-03-02 09:53:52
产业智能化的百度经验:飞桨结合智能云,让AI赋能千行万业
10月17日-19日,2019年中国计算机大会(CNCC2019)在苏州举办,本届大会以“智能+引领社会发展”为主题,1000家机构的代表、8000余人参展参会。百度首席技术官王海峰在会上发表题为《深度学习平台支撑产业智能化》的演讲。
至顶网
科技行者 2019-10-20 19:45:59
让记忆力超群的人工神经网络"记住"更多:意大利比萨大学团队破解深度学习记忆难题
意大利比萨大学研究团队开发出深度残差回声状态网络(DeepResESN),通过创新的"时间残差连接"技术解决了深度神经网络的长期记忆问题。该方法在记忆性任务上性能提升65%以上,同时保持了储层计算训练快速的优势。研究提供了完整的数学理论分析和三类任务的实验验证,为需要长期记忆的AI应用(如天气预测、医疗诊断、金融分析)提供了新的技术选择。
至顶网
科技行者 2025-09-08 10:16:49
企业中的机器学习:下一个万亿级的增长从哪来?
每一个公司都将成为「机器学习」公司。
至顶网
科技行者 2020-07-22 15:11:02
AI来了,我们就要失业?失业哪有那么容易?
短短几年,从阿尔法狗的第一次出镜到如今几乎遍布全球每一个大小公司都在投资弱AI产业,AI这个名词已经从只有理工科类高精尖人士才能略知一二,发展到了如今任何一个会使用互联网甚至仅仅看报纸看电视的人都能和你聊上几分钟的话题。
至顶网
全葳 2018-05-23 11:40:36
多模态大语言模型能帮助理解人类语言吗?MMLA:一个全面的多模态语言分析基准
想象一下,你正在看一部喜剧片。剧中角色面无表情地说:"我棒极了。"单看文字,你可能认为这是自信的表达。但如果你看到他说这话时翻了个白眼,用讽刺的语调,你立刻就会理解——这是在自嘲或嘲讽他人。这种理解需要同时分析文字内容、表情和语调。这正是多模态语言分析的核心:通过整合多种信息渠道(如文本、视频和音频),来理解人类交流中的高级语义。
至顶网
科技行者 2025-04-29 12:19:48
苹果公司的AXLearn:让AI巨型模型训练变得像搭积木一样简单
苹果公司研究团队开发了AXLearn,一个模块化的大型AI模型训练系统。该系统采用严格的组件封装设计,能在GPU、TPU、Trainium等异构硬件上运行,将添加新功能的代码量从数百行减少到10行,实现了常数级的复杂度增长。研究团队创造了"代码行复杂度"指标来量化模块化优势,并通过大规模实验证明了系统的高性能和扩展性。
至顶网
科技行者 2025-07-18 09:33:29
<
上一页
453
454
455
456
457
458
459
460
461
462
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号