搜一下
用了 0.209661秒,为您找到
宝宝
计划
手机
软件
網纸
YB233
相关内容17629 条
解剖自然图像的秘密:伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"
这篇研究来自加州大学伯克利分校和谷歌研究院团队,探讨了什么让图像看起来"自然"这一问题。论文提出了一种识别自然图像特征的深度学习方法,通过训练神经网络区分真实照片与人工处理的图像,并能将"不自然"的图像转化为更自然的版本。研究不仅揭示了自然图像在颜色分布、纹理特征和内容语义等方面的规律,还展示了在图像修复、质量提升和伪造检测等领域的潜在应用,为理解人类视觉感知和改进AI图像生成提供了新视角。
至顶网
科技行者 2025-07-07 17:32:15
斯坦福大学新发现:大语言模型居然能自己学会当"翻译官"
斯坦福大学研究发现,主要用英语训练的大型语言模型竟能自发学会处理其他语言任务,无需明确教学。这种跨语言迁移能力随模型规模增大而显著提升,通过形成"通用语义空间"实现不同语言间的知识迁移。研究为降低多语言AI开发成本、支持资源稀缺语言提供了新途径,但仍面临性能不均衡、文化适应性等挑战。
至顶网
科技行者 2025-08-21 12:25:17
波士顿大学揭秘:只听声音就能"看见"说话者,AI如何读懂声音里的视觉密码
波士顿大学研究团队开发出Audio2Face人工智能系统,能够仅通过音频信号生成对应的面部动画。该技术通过深度学习分析声音中的细微特征,准确率达87.3%,可应用于视频通话、影视制作、教育康复等领域。研究揭示了声音与视觉之间的深层联系,为跨模态人工智能开辟新方向,但也带来隐私保护和技术滥用等挑战。
至顶网
科技行者 2025-08-29 12:03:48
北京大学联合字节跳动推出MoVieS:用一秒钟就能从单镜头视频中生成4D动态场景的神奇技术
北京大学联合字节跳动推出MoVieS技术,能够从单镜头视频中快速重建4D动态场景。该系统采用"动态溅射像素"概念,统一处理场景外观、几何和运动信息,在一秒内完成传统方法需要数小时的重建任务。技术支持新视角合成、3D点追踪、场景流估计等多种应用,在保持高质量的同时实现数量级的速度提升。
至顶网
科技行者 2025-07-22 09:23:44
科学家如何"复活"古老植被:利用古DNA还原过去环境的研究突破
说到底,这项由爱丁堡大学埃洛伊丝·克雷文博士领导的研究为我们打开了一扇通往过去的神奇之门。通过从北极永久冻土中提取和分析古老的DNA片段,研究团队成功重建了北极地区几千年来的植被变化历史,揭示了植物群落对气候变化的复杂响应模式。
至顶网
科技行者 2025-07-07 17:31:27
2018年中国大数据BI行业分析报告
帆软数据应用研究院调研了规模不一的216家企事业单位,了解到他们的大数据BI应用状态、需求情况、对大数据BI产品功能的期待,同时基于帆软数据应用研究院对行业的长期观察和思考,形成了该篇报告。
至顶网
帆软数据应用研究院 2018-02-26 10:28:33
选择一个工具,还是选择了一个生态——Unity如何为中国创新者装配“新引擎”
从游戏引擎这个梦开始的地方,到更多应用落地的广阔天地,看Unity是如何炼成的。
至顶网
周雅 2024-07-15 10:56:17
一个程序员的转型总结:如何从写代码到管团队
李飞曾经是公司里技术最精湛的程序员,当他晋升成为技术负责人后,他发现许多事情不再像写代码那样简单。
至顶网
尼酱 2022-06-16 16:23:50
印度裔创业者视角:Perplexity创始人谈技术迭代、开源竞争与搜索革命
最近我们留意到,阿拉温德在哈佛商学院2025创业峰会上,与Xfund管理合伙人Patrick Chung有一场深度对话,他大谈创业心得。从印度的电气工程学生,到改变搜索引擎格局的CEO,阿拉温德的故事提醒我们,在技术领域,最具变革性的创新,往往来自于能够跨越学术与商业鸿沟之处。
至顶网
周雅 2025-04-26 22:37:21
大模型的"认知僵化"问题:ByteDance团队揭示AI为何总是"按套路出牌"
ByteDance团队发现大语言模型存在"认知僵化"问题:当用户要求执行与训练习惯冲突的指令时,AI往往难以遵从。研究团队开发了Inverse IFEval测试体系,包含8种反常规指令类型和1012个测试样本,发现即使最先进的模型在此类任务上表现也不理想。研究揭示了过度标准化训练导致模型缺乏灵活性的根本原因,为开发更适应用户真实需求的AI系统提供了重要指导。
至顶网
科技行者 2025-09-24 10:27:35
AMD“GENOA”EPYC服务器CPU为何备受关注?
做出好的服务器CPU绝非易事。毕竟超大规模服务商和云运营商每年都在激烈竞争,要求用更少的钱买到更强的性能,所以很难找到比用服务器CPU满足他们的诉求更困难的业务。
至顶网
至顶网计算频道 2022-11-11 14:45:39
给我FP32,否则免谈!Rice大学团队揭秘大模型推理中的致命精度陷阱
这项研究揭示了大语言模型推理中的一个重要问题:数值精度会显著影响结果的可重现性。研究团队发现,即使使用相同设置,不同硬件配置下模型输出可能截然不同,准确率差异可达9%。他们提出了LayerCast解决方案,在保持内存效率的同时提供高精度计算,为AI研究的可重现性提供了实用工具。
至顶网
科技行者 2025-06-17 10:44:16
选择一个工具,还是选择了一个生态——Unity如何为中国创新者装配“新引擎”
从游戏引擎这个梦开始的地方,到更多应用落地的广阔天地,看Unity是如何炼成的。
至顶网
周雅 2024-07-14 19:42:58
谷歌DeepMind推出全新AI系统:让机器人像人类一样学会"举一反三"
谷歌DeepMind联合多家顶尖机构推出RT-X系统,这是首个具备类人学习迁移能力的通用机器人AI。通过整合22个研究机构的50万次操作数据,RT-X能够像人类一样将已学技能灵活应用到新环境,成功率比传统方法提高50%以上,展现出跨领域适应和创造性解决问题的能力,为机器人智能化发展开辟了全新道路。
至顶网
科技行者 2025-09-08 10:21:42
百川智能发布全能AI助手:一个模型同时理解文字、图片、视频和语音的技术突破
百川智能发布突破性AI模型Baichuan-Omni-1.5,实现文字、图像、视频、音频的统一理解与生成。该7B参数模型在多项测试中超越同类产品,特别在医疗图像理解方面达到83.8%准确率,超过72B参数竞争模型。研究团队使用500亿高质量多模态数据,创新的四阶段训练策略,以及独创的音频处理技术,解决了多模态AI的关键技术难题,为人机交互开辟新方向。
至顶网
科技行者 2025-09-17 13:33:02
埃因霍芬理工大学团队用AI"擦拭"心脏超声影像的技术突破
荷兰埃因霍芬理工大学研究团队开发出一种智能心脏超声除雾技术,能够自动识别图像中被"雾霾"污染的区域并进行有针对性清理。该技术结合语义分割和扩散模型,首先让AI识别心脏各部分结构,然后根据不同区域特点采用不同强度的除雾处理,在国际挑战赛中表现优异,为解决心脏超声图像质量问题提供了新思路。
至顶网
科技行者 2025-09-02 09:33:02
专访|DoorDash掌门人:从濒临倒闭到主宰美国外卖市场,如何缔造一个全新商业帝国
DoorDash联合创始人兼CEO Tony Xu(徐讯)与YC董事长Garry Tan展开了一场关于创业精髓的访谈,讲述了公司的起源故事、公司如何在几次危机中幸存下来、以及如何改变整个行业。
至顶网
周雅 2025-04-09 21:22:44
低资源语言的AI也要会"看图说话":上海AI实验室破解多语言视觉AI文化盲区难题
上海AI实验室等机构联合发布MELLA项目,通过创新的"双源数据策略"解决了多语言视觉AI的文化理解难题。该研究构建了包含680万样本的大规模数据集,涵盖8种低资源语言,让AI既能流利表达又能理解文化内涵。实验显示文化理解能力提升150%以上,为全球数十亿非英语用户带来更优质的AI服务体验。
至顶网
科技行者 2025-08-13 10:55:51
NVIDIA发布数据秘籍:如何让AI模型变得更聪明,只需调整"饮食搭配"
NVIDIA联合佐治亚理工学院发布CLIMB框架,首次实现AI训练数据配方的全自动优化。该系统能智能分析和分类海量网络数据,通过迭代搜索找出最佳数据混合比例。实验显示,使用CLIMB优化的数据配方训练的1B参数模型性能超越Llama-3.2-1B达2%,在特定领域提升可达5%。研究团队已开源相关数据集。
至顶网
科技行者 2025-07-17 09:23:07
IBM研究院带来语音理解新突破:让AI更懂人话的训练秘籍
IBM研究院开发出群体相对策略优化(GRPO)方法来训练语音感知大语言模型,通过让AI生成多个答案并比较优劣进行学习,在语音问答和自动翻译任务上取得显著性能提升。实验显示该方法比传统监督微调效果更好,BLEU分数最高提升10.9%,为语音理解AI的发展开辟了新路径。
至顶网
科技行者 2025-10-15 12:07:04
<
上一页
866
867
868
869
870
871
872
873
874
875
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号