搜一下
用了 0.213980秒,为您找到
澳洲
幸运
10
怎么
才能
網纸
YB233
相关内容14318 条
ByteDance智能创作实验室与清华大学联手:让任何人都能制作电影级说话视频
ByteDance智能创作实验室与清华大学联合发布HuMo系统,这是首个实现文字、图片、音频三模态协同控制的人物视频生成框架。该系统通过创新的渐进式训练方法和时间自适应引导策略,让用户仅需提供文字描述、参考照片和音频就能生成电影级说话视频,在多项评测中超越现有专业系统,为内容创作带来革命性突破。
至顶网
科技行者 2025-09-12 16:50:07
AI无法处理长文档?字节提出人工海马网络,让AI像人脑一样高效处理超长信息
AI无法处理长文档?字节提出人工海马网络,让AI像人脑一样高效处理超长信息
至顶网
至顶AI实验室 2025-10-13 15:43:50
AI绘画界的"反作弊神器":清华大学团队推出T-LoRA技术,让AI不再"背答案"
清华大学团队推出T-LoRA技术,解决AI绘画中的"背答案"问题。该技术通过时间步骤的智能控制和正交初始化,让AI在学习单张照片时既保持特征准确性,又避免过度记忆背景等细节,生成更有创意和多样性的图像。实验显示T-LoRA在文本对齐度方面比传统方法提升约
10
%,为AI创意产业开辟新可能性。
至顶网
科技行者 2025-07-21 09:12:37
分析:中美关系危机深度冲击芯片产业
我们也想知道他是否也认为,世界正在把中国推向一个角落,如果是的话,可能会产生这样的后果。最后我们问,如果我们失去全球第三大半导体供应商华为,全球电子行业可能会受到怎样严重的影响。
至顶网
EETimes 2019-02-26 16:09:10
我们应该如何记忆这场瘟疫?
瘟疫正离我们很近,但在多数时光里,瘟疫又离我们很远。
至顶网
高飞 2020-02-14 10:57:31
Google DeepMind推出Gemma 3:轻量级多模态AI模型的革命性突破
Google DeepMind发布Gemma 3多模态AI模型家族,参数量从1B到27B,支持文字、图片理解和多语言处理,可在普通设备运行。创新的5:1注意力架构将内存消耗降低75%,支持128K长文档处理。在多项测试中表现优异,27B版本在聊天机器人竞技场排名第9,超越了许多更大规模的模型,实现了AI技术的真正民主化。
至顶网
科技行者 2025-08-01 10:13:44
华盛顿大学团队推出"AI城市向导":让街景图像开口说话,用双眼带你看遍世界每个角落
华盛顿大学等顶尖机构联合推出地理视觉代理概念,让AI能够分析街景、用户照片等视觉数据,回答"咖啡店门在哪里、是否无障碍"等具体问题。团队开发了三个原型:帮助盲人探索街景的StreetViewAI、为残障人士评估环境的Accessibility Scout,以及个性化骑行路线规划的BikeButler,展现了AI与地理信息结合的巨大潜力。
至顶网
科技行者 2025-08-29 09:30:28
《谍中谍8:最终清算》中出现的“智体”照进现实,哥伦比亚大学研究团队打造出真正的“自进化智体"
当AI学会自我进化:一台能不断重写自身代码的"达尔文哥德尔机器"正在实验室诞生,它像有创造力的厨师,不仅按食谱做菜,还能发明新菜谱并改进烹饪技术——这项突破让AI首次实现真正的自主进化,编程成功率从20%跃升至50%。
至顶网
至顶AI实验室 2025-06-10 09:28:47
“具身智能 产业智变新引擎”2024科技创变者大会成功举行
具身智能作为人工智能领域的一颗璀璨新星,正引领着新一轮的技术革命。
至顶网
至顶网人工智能频道 2024-08-09 18:53:11
“用智能,开启无限可能” 2024惠普商用AI战略暨AI PC新品发布会盛大举行,智领无界未来
“用智能,开启无限可能。”
至顶网
业界供稿 2024-05-09 19:10:53
从一个工具到多个专家助手:字节跳动和浙江大学团队如何让AI创作图文内容变得"身怀绝技"
这项由浙江大学和字节跳动联合完成的研究提出了LLM-Interleaved(LLM-I)框架,突破了现有AI图文创作系统的"单工具"瓶颈。该系统让大语言模型充当智能指挥官,根据需求调用在线搜索、图像生成、代码执行、图像编辑四种专业工具。通过创新的三重强化学习奖励机制训练,LLM-I在四个基准测试中均取得显著超越现有方法的表现,特别是在自建的LLMI-Bench基准上比GPT-4o高出25个百分点,工具调用成功率达到
10
0%。
至顶网
科技行者 2025-09-30 10:50:59
韩国KAIST团队首次解决文字图像修复难题,让老照片上的模糊文字重获新生
韩国KAIST团队首次提出文字感知图像修复技术,解决了传统图像修复无法准确恢复文字内容的难题。研究构建了包含
10
万张图像的SA-Text数据集,开发了TeReDiff模型,通过三阶段训练和智能提示机制,实现图像修复与文字识别的协同工作。实验显示该技术在文字识别准确率上比传统方法提升15-20%,为历史文献保护、档案数字化等领域提供了重要解决方案。
至顶网
科技行者 2025-06-17 13:13:40
大语言模型的智能"体检":帝国理工学院提出让AI提前知道自己不知道的神奇方法
这项由帝国理工学院研究团队开展的创新研究,提出了一种让AI在回答问题前先自我评估知识边界的"内部置信度"方法。该方法无需额外训练,通过分析AI内部各层的自信程度来判断其是否真正了解问题答案。实验证明这种"提前体检"式的方法能有效区分AI的已知和未知领域,并在智能检索和模型级联等实际应用中显著降低计算成本while maintaining性能,为构建更诚实可信的AI系统开辟了新路径。
至顶网
科技行者 2025-06-17 10:17:36
当AI学会了听音乐:卡内基梅隆大学推出史上首个音乐生成模型竞技场
这项研究首次为音乐生成AI建立了大规模实时评测平台Music Arena,通过让真实用户比较不同AI模型的音乐作品并投票,解决了传统评测成本高、标准不统一的问题。平台采用智能路由系统处理不同模型的异构特性,详细记录用户聆听行为,并承诺定期公开数据,为音乐AI研究提供了宝贵的用户偏好数据和标准化评估方法。
至顶网
科技行者 2025-08-04 13:34:38
《数字经济洞察周报》2023年第18期 |全球生成式AI产业图谱及报告在第七届世界智能大会发布
第七届世界智能大会成功召开,全球生成式AI产业图谱及报告发布。
至顶网
孙硕,吕敬儒 2023-05-26 17:10:33
深度:Nvidia如何借助AI赢得数据中心博弈
Nvidia在数据中心市场大获全胜的大门是敞开的,即使没有Arm,我们认为Nvidia也要比其他公司更有能力满足企业级技术的未来需求。
至顶网
siliconANGLE 2021-06-03 08:33:12
抖音团队打造全新视觉语言AI:SAIL-VL2以小博大,2B参数也能媲美大模型
抖音SAIL团队联合新加坡国立大学开发的SAIL-VL2多模态AI模型,以2B-8B的紧凑参数实现了超越大型模型的性能。通过精心的数据筛选、渐进式训练和架构优化,在
10
6个数据集测试中表现卓越,其中2B版本在4B以下开源模型中排名第一,8B-Thinking版本在推理任务上达到开源第一。该模型证明了"小而精"的发展路径,为AI技术的普及和高效部署提供了新思路。
至顶网
科技行者 2025-09-29 14:30:19
StepFun团队发布NextStep-1:让机器像人类一样逐步生成图像的新突破
StepFun团队发布的NextStep-1代表了AI图像生成领域的重要突破,采用自回归方式逐步生成图像,像艺术家作画般一点点构建视觉内容。这个14B参数的模型在多项测试中表现优异,不仅能高质量生成图像,还具备强大的编辑能力,为AI创作工具的发展开辟了新方向。
至顶网
科技行者 2025-08-19 10:19:29
斯坦福大学:机器人也能"听从内心声音",无需重新训练就能精准执行新任务
斯坦福大学推出DynaGuide技术,让机器人无需重新训练就能通过视觉示例学会新任务。该系统采用独立的动态模型为机器人提供实时行为指导,成功率达70%,在处理模糊指令时比传统方法强5.4倍。技术支持多目标引导和即插即用部署,已在真实机器人上验证成功,为个性化机器人服务开辟新路径。
至顶网
科技行者 2025-06-24 10:15:47
利而不争,携手共生——英特尔的“待客之道”
英特尔客户充分发挥英特尔客户至上的价值观,站在客户的角度,从客户的实际应用需求出发,为客户匹配到最合适且最具性价比的解决方案,并通过与客户一道进行反复的沟通测试,真正验证了英特尔平台级解决方案在真实应用场景中的价值。
至顶网
李祥敬 2020-10-26 11:57:25
<
上一页
703
704
705
706
707
708
709
710
711
712
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号