搜一下
用了 0.181008秒,为您找到
打牛
赢钱
软件
網纸
YB233
相关内容17244 条
新加坡南洋理工大学重新定义3D重建:像智能手机看视频一样理解三维世界
新加坡南洋理工大学研究团队开发的STREAM3R系统革命性地改变了3D重建方式,采用流式处理技术像阅读故事一样按序处理图像,而非传统的同时处理所有图像。该系统实现每秒12-33帧的实时处理速度,准确度高达94.7%,特别擅长处理动态场景,为自动驾驶、机器人导航和虚拟现实应用开辟了新可能。
至顶网
科技行者 2025-08-19 10:40:49
华盛顿大学新发现:大型语言模型竟能看懂手语,背后原理令人惊叹
华盛顿大学研究团队发现,大型语言模型在未接受手语训练的情况下,竟然具备理解德语手语的能力。通过系统实验,他们证实了模型能够判断手语语法正确性,并进行手语与文字间的翻译。这种"涌现的多模态能力"源于模型对语言抽象结构的深度理解,为开发手语翻译技术和改善聋哑人群数字交流体验开启了新可能。
至顶网
科技行者 2025-07-28 11:51:05
机器人学习新突破:华为诺亚实验室推出Python编程框架Ark,让机器人像玩乐高一样简单
华为诺亚实验室联合多家顶尖院校推出开源机器人编程框架Ark,通过Python优先设计和模块化架构,实现仿真与现实环境的无缝切换。该框架大幅降低机器人编程门槛,支持现代AI技术集成,为机器人学习研究提供统一平台,有望加速机器人技术普及。
至顶网
科技行者 2025-07-02 09:10:12
莫斯科理工大学研究团队发明AI"拼积木"新方法:让机器学习像生物成长一样自然生长
莫斯科理工大学研究团队提出革命性AI训练新方法,通过固定视觉嵌入层实现模块化组装和渐进式生长。专业模型可像拼积木般无缝合并,AI系统能像生物般逐层发育。实验证明合并模型性能优于单体专家,深度增加能显著提升复杂推理能力。这种方法有望推动AI发展从资源密集型向生态化转变。
至顶网
科技行者 2025-07-21 10:02:33
华盛顿大学新发明:让你的电脑同时运行多个AI应用而不卡顿的神奇测试工具
华盛顿大学研究团队开发了ConsumerBench测试框架,专门评估个人设备上多AI应用并发运行的性能。研究发现贪婪资源分配导致应用间严重不公平,语音识别等轻量应用被图像生成等重型应用"饿死";静态GPU分区虽然公平但效率低下;模型共享存在配置冲突。该框架为个人设备AI应用优化提供了重要指导。
至顶网
科技行者 2025-06-26 10:10:02
AWS销售负责人访谈:AWS如何引领生成式AI发展
云计算领域,AWS能否保持领先地位?
至顶网
至顶网软件与服务频道 2023-07-04 10:08:29
吴声年度演讲全文:新物种时代的场景战略
2021年8月15日,一年一度的“新物种爆炸·吴声商业方法发布2021”如约而至,以下为《吴声造物》梳理的演讲全文。
至顶网
业界供稿 2021-08-16 17:37:20
微软推出RealPlay:用AI把游戏世界变成现实世界的神奇技术
微软等机构联合推出的RealPlay系统首次实现了用游戏控制指令生成现实视频的突破。该系统仅使用赛车游戏数据训练,却能控制现实中的汽车、自行车和行人运动,控制成功率达90%。RealPlay支持交互式视频生成,用户可像玩游戏般逐步指导视频发展,生成质量接近真实拍摄,为AI视频生成和未来游戏引擎开发开辟了新方向。
至顶网
科技行者 2025-06-27 10:27:10
世界模型的全新架构:卡内基梅隆大学团队提出PAN模型,让AI拥有"大脑中的虚拟世界"
卡内基梅隆大学研究团队深入分析了当前世界模型的根本缺陷,提出了PAN架构。该研究发现现有系统过分关注视觉效果而忽略智能推理,提出混合表示和多尺度推理的解决方案。PAN采用离散标记和连续嵌入的组合,通过增强的大语言模型和扩散预测器实现真正的"思想实验"能力,为AI从内容生成器向智能推理系统的转变提供了新路径。
至顶网
科技行者 2025-07-18 09:35:00
解剖自然图像的秘密:伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"
这篇研究来自加州大学伯克利分校和谷歌研究院团队,探讨了什么让图像看起来"自然"这一问题。论文提出了一种识别自然图像特征的深度学习方法,通过训练神经网络区分真实照片与人工处理的图像,并能将"不自然"的图像转化为更自然的版本。研究不仅揭示了自然图像在颜色分布、纹理特征和内容语义等方面的规律,还展示了在图像修复、质量提升和伪造检测等领域的潜在应用,为理解人类视觉感知和改进AI图像生成提供了新视角。
至顶网
科技行者 2025-07-07 17:32:15
斯坦福大学新发现:大语言模型居然能自己学会当"翻译官"
斯坦福大学研究发现,主要用英语训练的大型语言模型竟能自发学会处理其他语言任务,无需明确教学。这种跨语言迁移能力随模型规模增大而显著提升,通过形成"通用语义空间"实现不同语言间的知识迁移。研究为降低多语言AI开发成本、支持资源稀缺语言提供了新途径,但仍面临性能不均衡、文化适应性等挑战。
至顶网
科技行者 2025-08-21 12:25:17
波士顿大学揭秘:只听声音就能"看见"说话者,AI如何读懂声音里的视觉密码
波士顿大学研究团队开发出Audio2Face人工智能系统,能够仅通过音频信号生成对应的面部动画。该技术通过深度学习分析声音中的细微特征,准确率达87.3%,可应用于视频通话、影视制作、教育康复等领域。研究揭示了声音与视觉之间的深层联系,为跨模态人工智能开辟新方向,但也带来隐私保护和技术滥用等挑战。
至顶网
科技行者 2025-08-29 12:03:48
北京大学联合字节跳动推出MoVieS:用一秒钟就能从单镜头视频中生成4D动态场景的神奇技术
北京大学联合字节跳动推出MoVieS技术,能够从单镜头视频中快速重建4D动态场景。该系统采用"动态溅射像素"概念,统一处理场景外观、几何和运动信息,在一秒内完成传统方法需要数小时的重建任务。技术支持新视角合成、3D点追踪、场景流估计等多种应用,在保持高质量的同时实现数量级的速度提升。
至顶网
科技行者 2025-07-22 09:23:44
科学家如何"复活"古老植被:利用古DNA还原过去环境的研究突破
说到底,这项由爱丁堡大学埃洛伊丝·克雷文博士领导的研究为我们打开了一扇通往过去的神奇之门。通过从北极永久冻土中提取和分析古老的DNA片段,研究团队成功重建了北极地区几千年来的植被变化历史,揭示了植物群落对气候变化的复杂响应模式。
至顶网
科技行者 2025-07-07 17:31:27
2018年中国大数据BI行业分析报告
帆软数据应用研究院调研了规模不一的216家企事业单位,了解到他们的大数据BI应用状态、需求情况、对大数据BI产品功能的期待,同时基于帆软数据应用研究院对行业的长期观察和思考,形成了该篇报告。
至顶网
帆软数据应用研究院 2018-02-26 10:28:33
选择一个工具,还是选择了一个生态——Unity如何为中国创新者装配“新引擎”
从游戏引擎这个梦开始的地方,到更多应用落地的广阔天地,看Unity是如何炼成的。
至顶网
周雅 2024-07-15 10:56:17
一个程序员的转型总结:如何从写代码到管团队
李飞曾经是公司里技术最精湛的程序员,当他晋升成为技术负责人后,他发现许多事情不再像写代码那样简单。
至顶网
尼酱 2022-06-16 16:23:50
印度裔创业者视角:Perplexity创始人谈技术迭代、开源竞争与搜索革命
最近我们留意到,阿拉温德在哈佛商学院2025创业峰会上,与Xfund管理合伙人Patrick Chung有一场深度对话,他大谈创业心得。从印度的电气工程学生,到改变搜索引擎格局的CEO,阿拉温德的故事提醒我们,在技术领域,最具变革性的创新,往往来自于能够跨越学术与商业鸿沟之处。
至顶网
周雅 2025-04-26 22:37:21
AMD“GENOA”EPYC服务器CPU为何备受关注?
做出好的服务器CPU绝非易事。毕竟超大规模服务商和云运营商每年都在激烈竞争,要求用更少的钱买到更强的性能,所以很难找到比用服务器CPU满足他们的诉求更困难的业务。
至顶网
至顶网计算频道 2022-11-11 14:45:39
给我FP32,否则免谈!Rice大学团队揭秘大模型推理中的致命精度陷阱
这项研究揭示了大语言模型推理中的一个重要问题:数值精度会显著影响结果的可重现性。研究团队发现,即使使用相同设置,不同硬件配置下模型输出可能截然不同,准确率差异可达9%。他们提出了LayerCast解决方案,在保持内存效率的同时提供高精度计算,为AI研究的可重现性提供了实用工具。
至顶网
科技行者 2025-06-17 10:44:16
<
上一页
848
849
850
851
852
853
854
855
856
857
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号