搜一下
用了 0.182884秒,为您找到
澳洲
幸运
10
怎么
才能
網纸
YB233
相关内容8586 条
AI助手学会了看一周的视频并推理:新加坡南洋理工让机器拥有"超长记忆"和"工具思维"
新加坡南洋理工大学联合多个国际研究机构开发出突破性AI系统Ego-R1,首次实现对一周超长视频的智能理解和推理。该系统采用独创的"工具链思维"方法,让AI像侦探一样使用不同工具分步解决问题,在44.3小时视频理解任务中达到46%准确率,显著超越现有技术,为未来个人AI助手的发展开辟新道路。
至顶网
科技行者 2025-06-20 10:27:10
「人间清醒」80后程序员川哥
在一个焦虑的环境里,做一个淡定从容的人。
至顶网
至顶网码客人生频道 2022-05-27 15:14:34
生成式AI对气候变化的影响:既有好处,也有代价
生成式AI在推动应对气候变化的积极应对方面具有巨大的潜力。其中最强大的应用之一就是优化资源,包括减少浪费、提高效率并最终帮助减少碳排放。例如,生成式AI模型已被用于模拟天气模式、改进精准农业和建立起更强大的自然灾害预测模型。这对于细致了解并适应不断变化的气候格局显然至关重要。
至顶网
至顶网软件与服务频道 2024-11-18 10:26:40
日本大阪大学和捷克技术大学联合研究:CLIP能"读出"你的相机型号?揭秘AI模型中隐藏的图像痕迹
日本大阪大学和捷克技术大学研究发现,CLIP等AI视觉模型能从图像中识别相机型号、压缩方式等技术细节,准确率超80%。这种能力会影响模型对图像语义的判断,导致检索和识别结果出现偏差。研究分析了47种模型,发现视觉语言模型最敏感,自监督模型相对较好。团队还发现训练时使用数据增强技术可降低这种敏感性,为改进模型提供了方向。
至顶网
科技行者 2025-08-19 10:40:23
7000万高质量视频文本对!文生视频最大的开源数据集Panda-70M来了!
数源AI推荐的论文介绍了Panda-70M数据集,该数据集通过多模态教师模型自动为7000万个视频生成高质量字幕。研究表明,该数据集在视频字幕生成、视频文本检索和文本驱动视频生成等下游任务上表现优异。
至顶网
数源AI 2024-03-05 17:04:20
PDF 数据提取:为何依然是数据专家的噩梦
多年来,企业、政府和研究人员一直在努力解决从 PDF 文件中提取可用数据的难题。PDF 文件虽然广泛应用于存储各类文档,但其固定格式常常使数据难以被机器读取和分析。传统 OCR 技术在处理复杂布局时效果欠佳,而新兴的 AI 语言模型虽有潜力,但也存在幻觉和误解等问题。目前仍无完美解决方案,这个挑战将持续影响数据分析和机器学习领域。
至顶网
Arstechnica 2025-03-12 15:15:07
HPC、AI与云计算:当智能时代三叉戟在亚马逊云科技完美融合
在很多人的印象中,HPC高性能计算、AI、云服务的三叉戟还处在各自独立,并行发展的阶段,尤其在云端实现高性能计算似乎还过于前卫。
至顶网
至顶网云计算频道 2022-08-18 15:33:34
阿里达摩院VACE:一个模型搞定所有视频创作,从文字到视频再到精细编辑全包了
阿里达摩院推出VACE系统,这是首个能够统一处理文字转视频、视频编辑、遮罩编辑等12种视频任务的AI模型。通过创新的视频条件单元(VCU)和上下文适配器架构,VACE不仅能单独完成各类视频生成编辑任务,还支持任务组合创造出传统方法无法实现的效果,为视频创作提供了革命性的一站式解决方案。
至顶网
科技行者 2025-08-01 10:14:02
阿里云发布“自动驾驶”级数据库平台DAS,让数据库从“手动”进入“自动驾驶”新时代
从传统数据库到云原生数据库,相当于从马车时代进入汽车时代,但还需要驾驶员,而阿里云数据库自治服务DAS就相当于给云原生数据库加上了自动驾驶引擎,让汽车从此具备了自动驾驶的能力。
至顶网
邹大斌 2020-04-26 10:00:21
天味食品的转型“秘方”:如何从信息化“零基础”到数字化“全武装”
时间转折点发生在2019年4月。
至顶网
高玉娴 2021-08-25 17:18:39
深醒科技袁培江:安防+AI,市场真的成熟了吗?
11月30日,亿欧科技频道主办的“新技术·新动能”创新者论坛在北京·国贸大酒店举办。
至顶网
业界供稿 2018-12-07 18:17:11
“女博士”张晴晴的硬核AI创业经:做数据难于做芯片
人们普遍认为,AI科学家每天的工作是构建高大上的模型,但其实绝大多数时间都用在了数据上,他们也想用好的数据帮助建模,但结果却是像围城一样——这是很多AI科学家共同的难题。
至顶网
周雅 2023-02-26 23:38:42
给AI"投喂"高质量数据:如何让机器像人类一样看懂世界?
这项研究创建了包含
10
,6
10
张高质量摄影图片的DSD数据集,每张图片都配有三层人工标注和精确分割。通过对比实验证明,使用高质量数据训练的AI视觉模型在图像理解和描述能力上显著优于传统方法,其中LLAVA-NEXT模型性能提升达24%,验证了"数据为王"的AI发展新范式。
至顶网
科技行者 2025-06-12 08:09:12
戴尔PowerEdge 两款服务器,通过国家级实验室边缘能力测试
纵览计算机的发展史,用三国定律“分久必合,合久必分”来形容可以说毫不违和。
至顶网
戴尔 2022-08-08 11:51:49
机器人终于会"想"再"动"了——艾伦人工智能研究院的MolmoAct模型让机器人拥有空间推理能力
艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。
至顶网
科技行者 2025-08-14 10:29:17
Omni-R1:浙大团队打造全模态推理新范式,让AI同时掌握视频、音频和精细像素理解能力
浙江大学研究团队提出的Omni-R1是一种创新型全模态AI框架,它采用"双系统"协作架构解决了长时间视频理解与精细像素处理之间的根本矛盾。全局推理系统处理低分辨率完整视频并选择关键帧,细节理解系统则对高分辨率关键帧进行精细分析。通过端到端强化学习方法训练,Omni-R1在指代音视频分割和推理视频物体分割等任务中显著超越了现有模型,同时还意外地减轻了多模态幻觉问题。这一研究为构建更全面的通用AI基础模型提供了新思路。
至顶网
科技行者 2025-05-29 17:16:55
用友的AI方法论,是帮企业搞定上下文工程?
在深圳的2025全球商业创新大会上,用友试图正在基于新的BIP5平台解决上下文工程的问题。
至顶网
高飞 2025-08-28 18:32:51
韩国大学和KAIST联手揭秘:给AI"老师"量身定制的视频推理训练新方法!
韩国大学和KAIST研究团队提出了DeepVideo-R1,一种革新性的AI视频理解训练方法。该方法通过回归式GRPO和难度感知数据增强两大创新,解决了传统方法中的梯度消失和训练信号稀疏问题。在多个权威测试中显著提升了AI的视频推理能力,特别是在处理未见过的新任务时表现出色,为AI视频理解技术发展开辟了新方向。
至顶网
科技行者 2025-06-19 12:14:04
用友的AI方法论,是帮企业搞定上下文工程?
在深圳的2025全球商业创新大会上,用友试图正在基于新的BIP5平台解决上下文工程的问题。
至顶网
高飞 2025-08-28 18:39:24
机器人学习新突破:华为诺亚实验室推出Python编程框架Ark,让机器人像玩乐高一样简单
华为诺亚实验室联合多家顶尖院校推出开源机器人编程框架Ark,通过Python优先设计和模块化架构,实现仿真与现实环境的无缝切换。该框架大幅降低机器人编程门槛,支持现代AI技术集成,为机器人学习研究提供统一平台,有望加速机器人技术普及。
至顶网
科技行者 2025-07-02 09:10:12
<
上一页
309
310
311
312
313
314
315
316
317
318
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号