搜一下
用了 0.046109秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容3164 条
波斯语AI视觉模型的教育大考:卡塔尔和伊朗研究团队推出首个波斯语多模态评估基准
波斯语AI评估基准MEENA的发布填补了非英语视觉语言模型测试的空白。数据集包含约7500道波斯语原生题目,涵盖多教育阶段和学科领域,采用五种实验设计全面测试AI能力。研究发现AI在知识型任务上优于推理任务,存在明显的语言性能差距,为推动多语言AI技术发展提供重要参考。
至顶网
科技行者 2025-09-01 15:54:04
从看电视到AI眼中的世界:Meta和UC Berkeley如何让机器像人类一样"看"视频
Meta和UC Berkeley联合研究团队开发了名为Toto的AI模型,通过"看前猜后"的方式学习理解视频。该模型观看了超过十万小时视频内容,在图像分类、视频理解、物体跟踪和机器人操作等多个任务中表现出色,甚至自然涌现了"物体永恒性"理解能力。研究发现视觉AI也遵循类似语言模型的缩放定律,但效率略低于语言模型。这项工作为构建通用视觉AI系统提供了新思路。
至顶网
科技行者 2025-09-16 10:30:57
让AI看懂视频因果关系:女王大学突破视频推理技术壁垒
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。
至顶网
科技行者 2025-07-09 15:45:45
港中文突破!让AI学会"一步步思考"生成图像,告别胡乱画图时代
港中文团队开发的T2I-R1系统首次让AI学会"思考式"图像生成,通过语义规划和细节优化的双层推理机制,在复杂图像生成任务上比基础模型提升13-19%,甚至超越了业界最强的FLUX.1模型,为AI创意产业应用开辟新路径。
至顶网
科技行者 2025-07-10 15:42:03
在华为的试用期,我决定离职
欲戴王冠,必承其重。
至顶网
Bai Bing 2022-06-14 11:27:01
在华为的试用期,我决定离职
欲戴王冠,必承其重。
至顶网
Bai Bing 2022-06-16 16:31:20
虚拟试衣新突破:NXN Labs研发的"换衣神器"让你秒变时尚博主
韩国NXN Labs开发的Voost系统实现了虚拟试衣技术的重大突破,能够同时处理"试穿"和"脱衣"两个相反任务。该系统使用统一的AI模型和创新的双向学习方法,在图像质量、细节保持和结构准确性方面都超越了现有技术,为电商购物和时尚行业带来革命性改变。
至顶网
科技行者 2025-08-13 10:57:35
香港中文大学团队让AI成为卡通制作神器:一张图加几笔线稿就能生成完整动画片
香港中文大学等机构联合研发的ToonComposer系统实现了动画制作的重大突破,仅需一张彩色图片和几张线稿草图即可自动生成完整卡通动画。该系统通过稀疏草图注入机制和空间低秩适配器技术,将传统的中间帧绘制和上色工作整合为统一的"后关键帧制作"阶段,大幅提升制作效率。实验显示其在视觉质量和动作连贯性等指标上显著超越现有方法,为动画产业的智能化发展开辟新路径。
至顶网
科技行者 2025-08-19 10:46:28
大数据时代的AI考官:人大团队打造奥数级数学推理基准,全球顶级AI只能得30分
人民大学团队创建了OlymMATH,这是首个奥数级AI数学推理基准测试,包含200道双语题目。测试结果显示,即使最先进的AI模型如Gemini 2.5 Pro在困难题目上也只能达到58.4分,揭示了当前AI在复杂数学推理方面的真实能力边界,为未来AI发展指明了方向。
至顶网
科技行者 2025-07-30 20:50:09
小米研究院推出革命性GUI自动化框架:让AI像人一样"眨眼-思考-执行"操作界面
小米研究院推出的BTL-UI是一个革命性的GUI智能代理框架,通过模拟人类"眨眼-思考-执行"的认知过程,让AI能够像人类一样自然地操作各种应用界面。该技术在多个基准测试中实现了显著性能提升,为未来的人机交互和自动化应用奠定了重要基础。
至顶网
科技行者 2025-10-09 12:19:52
腾讯AI实验室发现:聪明的AI也会"思维跳跃",新方法让机器学会深度思考
腾讯AI实验室发现先进AI模型存在"思维不足"问题:在解决困难问题时频繁跳跃思路而非深入思考,导致错误答案消耗225%更多资源。研究团队提出TIP方法,通过惩罚思维切换来训练AI专注力,显著提升推理效率和准确性。这项发现改变了我们对AI推理过程的认知,强调深度思考比广度探索更重要。
至顶网
科技行者 2025-09-17 13:32:24
腾讯混元团队推出P3-SAM:让AI像人一样精准拆解3D物体
腾讯混元团队推出P3-SAM系统,这是首个能够自动精确分割任意3D物体的AI模型。该系统采用原生3D处理方式,摆脱了传统方法对2D投影的依赖,在近370万个3D模型上训练而成。P3-SAM支持完全自动分割和交互式分割两种模式,在多个标准测试中达到领先性能,为游戏开发、工业设计等领域提供了强大的3D理解工具。
至顶网
科技行者 2025-09-19 11:08:24
观远数据发布一站式BI 6.0:融合大语言模型,赋能数据驱动的敏捷经营
2023年,在复杂严峻的外部环境影响下,商业环境愈发多变难测,市场进入周期更替的“蕴新”时刻,对企业应对内外变化的能力提出更高要求。
至顶网
业界供稿 2023-10-23 17:04:57
耶鲁大学研究揭秘:大语言模型在科学推理中究竟是缺乏知识还是推理能力?
耶鲁大学研究团队通过构建SCIREAS评估体系和KRUX分析框架,系统研究了大语言模型在科学推理中的表现。研究发现,模型的主要瓶颈不是推理能力而是知识检索能力,基础模型在获得外部知识支持后甚至能超越专门的推理模型。团队还开发了SCILIT01作为开源科学推理基线,为未来AI科学应用的改进提供了新方向。
至顶网
科技行者 2025-09-03 11:38:36
以色列团队推出"哨兵":AI世界的超级保安,专治恶意提示词攻击
这项研究展示了一个基于ModernBERT架构的prompt injection检测模型,通过精心构建的多样化数据集训练,在内部测试中达到98.7%准确率和98.0% F1分数,在公开基准测试中平均F1分数达93.8%,显著超越现有最强基线系统。该模型推理速度仅0.02秒,具备实时检测能力,为AI系统安全防护提供了新的解决方案。
至顶网
科技行者 2025-06-11 13:43:28
字节跳动推出FinSearchComp:让AI在金融搜索领域接受"真枪实弹"的考验
字节跳动联合哥伦比亚商学院推出首个开源金融搜索AI评测基准FinSearchComp,通过635个专业问题测试21个AI模型的金融数据搜索能力。研究发现最优AI模型在全球市场达到68.9%准确率,接近人类专家75%水平,但在复杂分析任务上仍存在显著差距,为AI在专业领域应用提供了重要的能力基准。
至顶网
科技行者 2025-10-13 08:57:42
天才程序员用AI重新定义虚拟世界创造:NetEase公司推出革命性游戏开发平台LatticeWorld
NetEase公司研究团队开发的LatticeWorld框架实现了虚拟世界生成的重大突破。该系统通过自然语言和草图输入,能够快速生成高质量的3D交互虚拟环境,效率比传统方法提升90倍以上。系统结合轻量级语言模型和工业级渲染引擎,支持动态角色交互和实时物理模拟,为游戏开发、教育培训等领域带来革命性变革。
至顶网
科技行者 2025-09-19 11:06:39
腾讯深圳大学革命性突破:让电脑理解语言的秘密武器终于诞生
腾讯和深圳大学联合开发的多视角语言理解技术取得重大突破,通过创新的训练方法让人工智能具备接近人类水平的语言理解能力。系统能准确识别讽刺、情感变化等复杂语言现象,在多项测试中表现优异,已在客服、教育、医疗等领域开始应用,未来有望广泛改善人机交互体验。
至顶网
科技行者 2025-08-27 10:31:04
上海交通大学团队突破:让AI轻松读懂复杂表格,像人类一样理解数据关系!
上海交通大学团队开发了名为ST-Raptor的智能系统,能够像人类专家一样准确理解医疗报告、财务报表等复杂表格结构。该系统创新性地使用"层次正交树"表示方法和九种基础操作工具,配合智能问题分解和双重验证机制,在复杂表格分析任务中准确率达到72.39%,比现有最佳方法提升20%以上,有望广泛应用于医疗、金融、教育等领域。
至顶网
科技行者 2025-09-01 15:51:48
哈佛大学揭秘:AI如何像人类一样通过"玩游戏"学会复杂推理
哈佛大学研究团队通过创新的多智能体强化学习方法,让AI在战略游戏中学会复杂推理。研究发现AI通过游戏竞争能发展出类人思维能力,在逻辑推理、创造性解决问题等方面表现显著提升。这项突破性成果为未来AI在医疗、教育、城市管理等领域的应用奠定基础,展现了通过模拟人类学习过程培养真正智能AI的新路径。
至顶网
科技行者 2025-06-18 11:13:18
<
上一页
147
148
149
150
151
152
153
154
155
156
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号