搜一下
用了 0.063463秒,为您找到
北京
pk
精准
人工
计划
软件
網纸
YB233
相关内容5421 条
VisTA:一种会学习选择视觉工具的
人工
智能,仿佛给视觉AI配了个聪明助手
VisTA是一种新型强化学习框架,使视觉AI能够自主探索、选择和组合多种视觉工具。与传统方法不同,VisTA无需
人工
监督,通过反复尝试学习哪些工具最有效。研究团队在ChartQA、Geometry3K等测试中证明,VisTA显著优于训练免费基线,特别是在分布外样本上表现更佳。其核心创新在于使用群体相对策略优化算法,让AI代理能够根据实际性能而非预设规则来选择工具,为未来发展更灵活的视觉推理系统铺平了道路。
至顶网
科技行者 2025-05-30 16:21:57
创新再升级,办公更智慧 华为MateBook系列多款新品齐发
全球首款i9 Evo认证笔记本电脑华为MateBook 16s i9版本、华为首款大屏高性能轻巧本华为MateBook D 16、华为MateBook 14、华为MateBook D 14、华为显示器新成员华为MateView SE以及全新华为无线鼠标同台发布。
至顶网
业界供稿 2022-05-23 21:56:01
技术界的新突破:以色列理工学院研究团队让AI模型学会"思维延续"的神奇技能
以色列理工学院研究团队开发出一种新颖的AI推理改进方法,通过训练专用的"继续思考"标记,让AI模型在解题时能够进行更深入的思考。该方法只需训练单个标记的嵌入向量,保持模型其他参数不变,在数学推理任务中展现出显著效果,准确率提升幅度达到传统方法的三倍以上,为AI推理能力提升提供了高效且通用的解决方案。
至顶网
科技行者 2025-06-19 12:54:40
成均馆大学团队破解AI如何理解人类交互意图:让机器像人一样学会物体可供性
成均馆大学团队开发出选择性对比学习新方法,让机器通过观察人类交互场景学会识别物体功能部位。该技术突破传统局限,采用动态学习策略,能根据信息质量调整学习方式,在多个数据集上显著超越现有方法,为机器人、自动驾驶等领域的智能交互应用奠定重要基础。
至顶网
科技行者 2025-08-29 14:09:31
GPTailor:让大模型"瘦身"不再难!马克斯·普朗克研究所推出革命性AI模型压缩技术
马克斯·普朗克研究所推出GPTailor技术,通过多模型智能融合实现大语言模型25%参数削减的同时保持97%性能,为AI模型高效部署提供新思路。该方法将模型压缩从单一模型"减法"转变为多专业模型"重组融合",在14项基准测试中显著优于传统压缩方法。
至顶网
科技行者 2025-07-01 09:54:07
有想象的地方,就有视频云
2021,阿里云视频云全景创新峰会,努力尝试站在近景和远景之处,全景观察这个时代的超视频化课题。
至顶网
业界供稿 2021-07-15 17:20:50
俄罗斯研究团队推出光流估计新方法:让超高清视频分析更省内存、更
精准
俄罗斯莫斯科国立大学研究团队开发出MEMFOF光流估计新方法,在保持顶尖精度的同时将1080p视频分析的GPU内存消耗从8GB降至2GB,实现约4倍内存节省。该方法通过三帧策略、相关性体积优化和高分辨率训练在多个国际基准测试中取得第一名成绩,为高清视频分析技术的普及奠定基础。
至顶网
科技行者 2025-07-03 10:01:43
从“三驾马车”到“安全可持续” 戴尔科技全面开启现代化“新解法”
春季新品发布会上,戴尔科技从底层技术到终端应用的全方位创新得到了全面展示!
至顶网
毛烁 2025-04-25 13:25:25
STR-Match:视频编辑的新革命,首尔国立大学团队让视频换装就像换衣服一样简单
首尔国立大学研究团队提出STR-Match视频编辑技术,通过创新的时空相关性分数(STR分数)解决传统方法在帧一致性、运动保持和域转换方面的局限。该方法无需重新训练模型,可直接应用于现有文本到视频生成模型,在极端编辑场景下仍能保持高质量输出,为视频编辑领域带来突破性进展。
至顶网
科技行者 2025-07-04 17:20:09
突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"
西湖大学研究团队发表突破性论文,提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上,同时保持90%以上的准确率,有望解决当前AI系统"记忆不够用"的核心问题,为智能手机、医疗影像、自动驾驶等领域带来重大突破。
至顶网
科技行者 2025-08-04 13:34:06
加州大学圣克鲁兹分校联合Adobe等机构:让AI真正懂你——用知识图谱帮助大语言模型实现个性化文本生成
加州大学圣克鲁兹分校等机构联合开发的PGraphRAG框架,通过构建用户中心知识图谱解决了AI个性化服务的冷启动问题。该技术不再依赖单一用户历史数据,而是利用用户相似性网络实现个性化文本生成。在12项任务测试中,PGraphRAG在长文本生成上平均提升14.8%,在短文本生成上提升4.6%,为99.99%的数据稀少用户提供了个性化AI服务的可能。
至顶网
科技行者 2025-09-15 10:40:08
西门子的“新模式”,为什么能拉快数字化转型的“进度条”?
我们为什么需要一家数字化转型的“新店”?
至顶网
周雅 2023-09-27 13:14:32
阿联酋研究团队打造AI"读心术":从照片和文字中破解人格密码
阿联酋研究团队创建了PersonaX数据库,包含超过1.3万人的多模态性格分析数据。通过整合面部照片、背景信息和AI生成的行为特征描述,研究首次实现了大规模的跨模态性格分析。团队开发的双层分析框架不仅能发现统计关联,还能揭示深层因果关系,为理解人类性格特征提供了全新视角。
至顶网
科技行者 2025-09-26 13:57:07
斯科尔科夫科技学院推出G-CUT3R:让AI秒懂现实世界的3D重建新玩法
斯科尔科夫科技学院等机构联合开发的G-CUT3R是一种创新的3D重建技术,通过巧妙融合相机参数、深度信息等辅助数据,显著提升了传统仅依赖RGB图像重建方法的准确性和速度。该技术采用轻量级设计和零卷积融合策略,在多个基准测试中表现出色,为自动驾驶、AR/VR、机器人导航等领域的实际应用开辟了新路径。
至顶网
科技行者 2025-08-27 15:12:46
西门子的“新模式”,为什么能拉快数字化转型的“进度条”?
我们为什么需要一家数字化转型的“新店”?
至顶网
周雅 2023-09-28 10:57:08
低资源语言的AI也要会"看图说话":上海AI实验室破解多语言视觉AI文化盲区难题
上海AI实验室等机构联合发布MELLA项目,通过创新的"双源数据策略"解决了多语言视觉AI的文化理解难题。该研究构建了包含680万样本的大规模数据集,涵盖8种低资源语言,让AI既能流利表达又能理解文化内涵。实验显示文化理解能力提升150%以上,为全球数十亿非英语用户带来更优质的AI服务体验。
至顶网
科技行者 2025-08-13 10:55:51
这穿越周期的骁龙,与生态握手,做时间的朋友
在不断发明新技术,启动新市场的过程中,高通并非独乐乐的“孤勇者”,而是始终以“生态赋能”为座右铭,以自己的方法论,创造不同的潮流,与伙伴们共同穿越周期。每一年的骁龙峰会,就是最佳例证。
至顶网
周雅 2022-12-06 10:36:09
这穿越周期的骁龙,与生态握手,做时间的朋友
在不断发明新技术,启动新市场的过程中,高通并非独乐乐的“孤勇者”,而是始终以“生态赋能”为座右铭,以自己的方法论,创造不同的潮流,与伙伴们共同穿越周期。每一年的骁龙峰会,就是最佳例证。
至顶网
周雅 2022-12-05 20:48:35
当AI学会解读人类的心:哈佛和微软团队让机器掌握情绪表达的密码
哈佛大学和微软研究院团队开发出突破性的多模态情感理解AI系统,能同时分析文字、语音、面部表情和肢体动作,情感识别准确率达95.7%,接近人类专家水平。该系统成功解决了传统技术无法理解讽刺、文化差异等复杂情感表达的难题,在医疗诊断、个性化教育、客户服务等领域展现巨大应用潜力,为实现真正理解人类情感的
人工
智能奠定了基础。
至顶网
科技行者 2025-08-22 10:53:14
让AI既能看人脸又能听声音:比利时和美国科学家的多感官"读心术"突破
比利时蒙斯大学和美国南加州大学联合开发了Social-MAE,这是一个能够同时理解人脸表情和声音情感的AI系统。该系统通过分析8个连续视频帧和音频特征,在VoxCeleb2大型社交数据集上进行自监督学习,在情感识别、笑声检测和性格分析三项任务中均达到了业界最佳水平,为智能教育、医疗诊断、人机交互等领域开辟了新的应用前景。
至顶网
科技行者 2025-09-05 10:12:02
<
上一页
257
258
259
260
261
262
263
264
265
266
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号