搜一下
用了 0.128032秒,为您找到
澳洲
幸运
10
骗局
網纸
YB233
相关内容14326 条
ROSE:让视频中的物体彻底"消失",连阴影也不留痕迹的神奇技术
ROSE是一项突破性的视频编辑技术,能够彻底移除视频中的物体及其环境影响。由浙江大学等机构研发,该系统不仅删除目标物体,还智能处理阴影、反射、光照等五种副作用。通过3D渲染生成训练数据,采用引用式擦除和差异掩码预测等创新方法,ROSE在各项性能指标上全面超越现有技术,为视频编辑领域带来了新的可能。
至顶网
科技行者 2025-09-04 10:00:46
港科大推出LazyDrag:一招搞定图片编辑难题,不用训练就能让照片"听话"
港科大研究团队开发的LazyDrag系统创新性地解决了图片拖拽编辑中的核心难题。该系统摒弃传统的隐式匹配方法,采用显式对应地图技术,实现了无需训练的高精度图片编辑。LazyDrag支持文字引导功能,能智能理解用户意图,在准确性和感知质量方面全面超越现有方法,为AI辅助图片编辑开辟了新方向。
至顶网
科技行者 2025-09-28 11:00:01
机器人不再需要"内感觉"?上海交通大学团队发现视觉就够了
上海交通大学研究团队发现,机器人仅依靠视觉就能完成复杂操作任务,无需传统的"内感觉"信息。这种"无状态"控制方法在环境变化时表现更好:高度变化测试中成功率从0%提升至85%,水平变化测试中从6%提升至64%。研究还显示该方法具有更高的数据效率和跨平台适应能力,为未来机器人技术发展开辟了新路径。
至顶网
科技行者 2025-10-14 12:09:38
AI视觉推理新突破:中国团队让机器像人一样"慢思考",仅用5千个文本案例就追平顶级商业系统
这项由中国人民大学等机构合作完成的研究提出了Virgo系统,发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性,为更经济高效地开发多模态AI系统指明了新方向,同时也揭示了AI感知反思能力不足的局限性。
至顶网
科技行者 2025-09-15 11:06:51
全能模型的困境:为什么让AI什么都会可能适得其反?
这项来自加州大学戴维斯分校和俄亥俄州立大学的研究探讨了多模态AI训练的一个重要问题:让AI同时学会处理文字、图像、视频等多种信息类型时,是否会影响其原有的语言能力?研究发现,扩展模态确实存在能力权衡,模型合并技术比全模态同步训练更有效,为AI发展提供了重要启示。
至顶网
科技行者 2025-06-10 11:38:31
Mistral AI首次推出推理模型Magistral:纯强化学习训练让AI学会"深度思考"
Mistral AI首次推出推理模型Magistral,采用纯强化学习训练让AI学会深度思考。该模型在数学推理能力上提升近50%,能够展示完整思考过程,并意外获得多模态推理能力提升。研究团队开源了Magistral Small模型,为AI推理能力发展开辟新路径,证明了强化学习在培养AI思维能力方面的巨大潜力。
至顶网
科技行者 2025-06-18 09:20:58
这5大新趋势+5大行业领域将定义2019年的科技和产业创新
今天我们先来探讨一下2019年科技和产业创新的新趋势。
至顶网
业界供稿 2018-12-06 10:34:48
圆桌论坛:企业如何服务美好生活?
在2018亿欧创新者年会下午,好享家CEO汪浩、小黑鱼科技联合创始人兼CMO陈福炜、新潮传媒创始人兼董事长张继学、亿欧公司副总裁李双就《企业如何服务美好生活?》做圆桌讨论。
至顶网
业界供稿 2018-12-11 16:21:24
腾讯AI Lab发布Locas:让AI像人一样"记住"长文本内容的突破性技术
腾讯AI Lab最新发布的Locas技术通过创新的"侧挂记忆"设计,让AI模型能够像人一样持续记忆长文本内容而不遗忘已有知识。该技术仅需0.02%额外参数就实现显著性能提升,在20万字文本处理和长对话问答任务中表现优异,为构建真正智能的AI记忆系统开辟了新路径。
至顶网
科技行者 2026-02-12 12:06:59
上海人工智能实验室发布全球首个世界探索视频数据集:让AI像人类一样"环游世界"
上海人工智能实验室联合多个机构发布了名为Sekai的全球首个世界探索视频数据集,包含超过5000小时来自
10
1个国家750个城市的第一人称视角视频。数据集配备位置、天气、场景等丰富标注,并基于此训练了YUME交互式世界探索模型,用户可通过键盘鼠标控制虚拟世界漫游,为虚拟旅游、教育、游戏等领域开辟新应用前景。
至顶网
科技行者 2025-06-24 15:42:41
上海人工智能实验室首创:用学术讲座训练AI研究助手的全新评测方案
上海人工智能实验室等多所高校联合开发了DeepResearch Arena评测基准,专门评估AI研究助手的真实能力。该系统创新性地使用学术讲座作为测试素材,通过MAHTG系统从200多场讲座中提取研究灵感并生成超过1万个研究任务。实验显示即使最先进的AI模型也面临显著挑战,为未来AI研究能力发展提供了重要参考。
至顶网
科技行者 2025-09-24 10:27:04
Meta开源世界模型V-JEPA 2:能看懂视频、预测未来、控制机器人的超级AI
Meta开源世界模型V-JEPA 2:能看懂视频、预测未来、控制机器人的超级AI
至顶网
至顶AI实验室 2025-06-16 17:03:47
人工智能遇上"偏科生"难题:中国人民大学团队让AI在不平衡世界中也能公平学习
中国人民大学研究团队提出LoFT方法,通过参数高效微调基础模型解决长尾半监督学习中的数据不平衡问题。该方法利用预训练模型的良好校准特性改进伪标签质量,并扩展出LoFT-OW版本处理开放世界场景。实验显示,仅使用传统方法1%的数据量就能取得更优性能,为AI公平性和实用性提供了新的解决方案。
至顶网
科技行者 2025-09-25 14:42:50
印度理工学院发布史上最大规模印度文化AI测试:15种语言64000题,揭示AI的文化盲区
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。
至顶网
科技行者 2025-10-14 12:11:56
让AI学会"团队协作":伊利诺伊大学团队开发出让多个AI模型协同工作的智能调度系统
伊利诺伊大学香槟分校研究团队开发了Router-R1,一个能让多个AI模型像团队一样协作的智能调度系统。该系统通过强化学习,学会在"思考"和"调用专家"之间灵活切换,能根据任务复杂度动态协调不同AI模型,同时平衡性能与成本。在七个问答数据集的测试中,Router-R1显著超越现有方法,平均准确率提升约20%,并展现出对未见过模型的强泛化能力。
至顶网
科技行者 2025-06-24 13:46:54
KAIST团队突破性视频检索技术:让AI在视频海洋中精准找到你想要的答案
KAIST研究团队开发的VideoRAG系统实现了人工智能在视频内容理解上的重大突破。该系统能够直接从海量视频中检索相关内容并生成准确答案,解决了传统方法只能处理文字和图片信息的局限。通过智能帧选择和多模态信息融合技术,VideoRAG在问答准确性上显著超越现有方法,为教育培训、技能学习等领域提供了全新的智能问答解决方案。
至顶网
科技行者 2025-09-18 11:06:33
华为:逆转操作系统之“熵”
无法被断供的鸿蒙,正在筑起一座城。
至顶网
高飞 2020-09-16 12:09:22
IntFold:IntelliGen AI突破蛋白质结构预测难题,可控制基础模型改写药物发现游戏规则
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。
至顶网
科技行者 2025-07-04 17:45:14
印第安纳大学团队:让机器人"眼睛"更聪明的视觉理解新方法
印第安纳大学研究团队提出AFRDA方法,通过自适应特征精炼模块解决跨域语义分割问题。该方法巧妙融合全局语义理解和局部细节分析,引入不确定性引导的双重注意力机制,在城市和森林环境适应任务中显著提升性能。轻量级设计确保计算效率,成功部署到真实机器人系统,为视觉导航和自动驾驶提供新技术路径。
至顶网
科技行者 2025-08-04 13:33:37
机器人学会自己进步:上海AI实验室让机器人在真实世界中像人类一样从错误中学习
上海AI实验室开发的VLAC模型让机器人首次具备真实世界自主学习能力。该系统如同给机器人配备智能导师,能实时评估动作效果并从中学习。在四个操作任务测试中,机器人成功率从30%提升至90%,仅需200次练习。技术结合视觉、语言理解和动作生成,支持跨场景适应和人机协作,为家庭服务、医疗护理等领域应用奠定基础。
至顶网
科技行者 2025-10-09 12:21:19
<
上一页
702
703
704
705
706
707
708
709
710
711
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号