用了 0.061634秒,为您找到彩神 APP 官方 最高 代理 内部 邀请 码罔芷 YB266CN 驻测相关内容5719 条
  • 史上最难的AI人格化考试:连最聪明的模型都考砸了!华为OPPO等联合发布PersonaFeedback基准

    这项由电子科技大学、香港中文大学等机构联合完成的研究,创建了PersonaFeedback基准来评估AI的个性化能力。研究包含8298个测试案例,分为三个难度等级,发现即使最先进的AI模型在个性化任务上表现也不理想。研究还发现推理能力提升不等于个性化能力提升,直接提供用户信息比让AI推测更有效。
    至顶网  科技行者  2025-06-20 10:26:49  
  • 香港科技大学突破性发现:让AI训练快人一步的神奇"刹车"技术

    香港科技大学研究团队提出GPAS技术,通过"梯度保持激活缩放"解决Pre-LayerNorm架构中激活方差指数增长问题。该技术在前向传播时缩放激活值,反向传播时保持梯度不变,在71M到1B参数模型上均显示显著性能提升。GPAS具有出色的架构兼容性,可应用于多种Transformer变体,为大型语言模型训练优化提供了简单有效的解决方案。
    至顶网  科技行者  2025-07-02 10:58:27  
  • Enigmata:通过合成可验证的拼图让大语言模型的逻辑推理能力扩展到新高度

    Enigmata是一项突破性研究,通过合成可验证的拼图训练大语言模型的逻辑推理能力。该研究创建了包含36种任务、7大类推理能力的完整训练系统,每项任务都配备了可控难度生成器和自动验证器。基于此训练的Qwen2.5-32B-Enigmata模型在拼图推理基准上超越了o3-mini-high和o1等顶尖模型。更令人惊喜的是,当应用于更大规模模型时,这些拼图数据不仅提升了模型解决拼图的能力,还意外增强了其数学和STEM推理能力,展示了纯逻辑训练带来的广泛泛化优势。
    至顶网  科技行者  2025-05-30 07:43:48  
  • ReSurgSAM2:新加坡国立大学团队打造的手术视频智能追踪系统,让外科医生用语言指令精准追踪手术工具与组织

    ReSurgSAM2是新加坡国立大学团队开发的两阶段手术视频分割系统,允许外科医生通过文本指令精准识别和追踪手术器械与组织。这项创新利用SAM2模型为基础,添加了跨模态空间-时间Mamba、可靠初始帧选择和多样性驱动长期记忆机制,解决了现有技术在长时间追踪和实时性能方面的局限。实验表明,该系统在准确性上显著超越现有方法,同时保持61.2 FPS的实时处理能力,为手术认知辅助、教育和导航提供了强大工具。
    至顶网  Hugging Face  2025-05-16 16:41:21  
  • Alita:极简设计打造无限创造力的通用AI助手

    Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。
    至顶网  科技行者  2025-06-01 11:15:55  
  • 香港大学、阿里巴巴联合推出TTS-VAR:让AI画画变得更聪明的全新框架

    本研究提出了首个针对视觉自回归模型的测试时缩放框架TTS-VAR,通过自适应批次管理、聚类式多样性搜索和重采样式潜力选择三大策略,将AI图像生成质量显著提升8.7%。该框架巧妙地将生成过程视为路径搜索问题,在早期保持结构多样性,后期进行智能选择,实现了计算效率与生成质量的双重优化,为视觉生成技术发展提供了新思路。
    至顶网  科技行者  2025-07-29 10:03:40  
  • 南洋理工大学最新突破:让静态3D模型"活"起来,自动骨骼绑定与动画生成技术

    南洋理工大学研究团队开发了名为Puppeteer的自动化系统,可将静态3D模型转换为完整的动画资产。该系统包含自动骨骼生成、智能皮肤绑定和视频引导动画制作三大核心功能,基于5.94万个高质量样本的大规模数据集训练。相比传统需要数周的手工制作,Puppeteer可在约30分钟内完成整个流程,在多项指标上显著超越现有方法,为3D内容创作的智能化转型提供了重要技术突破。
    至顶网  科技行者  2025-08-19 12:35:08  
  • 权威大咖、前沿课题、全链资源,第三届AIAED全球AI智适应教育峰会开幕在即

    “人工智能+教育”行业面临的挑战不是市场有多大,而是如何实现技术、数据、以及内容方面的有效协同,建立规范化的教育新体系,将蛋糕做大的同时更要做美、做稳。
    至顶网  至顶网人工智能频道  2019-05-16 14:03:22  
  • 自我进化智能体:机器如何像人类一样学习和成长?普林斯顿大学等多家机构揭秘通往超级人工智能的新路径

    普林斯顿大学等40多家顶尖机构联合发布首份自我进化智能体综合报告,系统阐述了AI从静态工具向自主学习伙伴转变的技术路径。研究揭示了智能体如何在模型、记忆、工具和架构四个层面实现自我优化,通过实时学习和课后总结两种时机持续进化,并在医疗、教育、编程等领域展现实用价值,为实现通用人工智能提供了清晰框架。
    至顶网  科技行者  2025-08-05 10:35:30  
  • 揭开真相:现有长视频理解评估其实靠猜?多伦多大学团队推出更公平的VideoEval-Pro评测基准

    这项研究揭示了现有长视频理解评估基准的严重缺陷:过度依赖多选题导致结果膨胀,且许多问题存在先验偏好使模型无需真正理解视频就能作答。针对这些问题,多伦多大学团队开发了VIDEOEVAL-PRO基准,采用开放式短答案形式,真正要求理解整个视频。通过评估21个专有和开源模型,研究发现:视频模型在开放式问题上的表现比多选题下降超过25%,且多选题高分并不意味着开放式题高分。与其他基准不同,VIDEOEVAL-PRO随输入帧数增加持续提升性能,提供了更可靠的长视频理解能力评估方法。
    至顶网  科技行者  2025-05-26 08:16:36  
  • 解锁清晰视界:孙中山大学研究团队开创"鲁棒高斯飞溅"技术,让3D场景重建告别干扰物

    孙中山大学研究团队开发的RobustSplat技术通过两大创新解决3D高斯飞溅重建中的瞬态物体干扰问题:延迟高斯增长策略优先优化静态结构,避免早期对动态物体过度拟合;尺度级联掩码引导方法先利用低分辨率特征实现可靠初始掩码估计,再过渡到高分辨率监督获得精确预测。实验证明该方法在多个挑战性数据集上明显优于现有技术,为真实场景3D重建提供更高质量、无干扰的结果。
    至顶网  科技行者  2025-06-09 16:57:05  
  • EXAONE 4.0:LG AI Research让AI能动能静,一个模型搞定快速回答和深度思考

    LG AI Research发布EXAONE 4.0大型语言模型,创新性地在单一模型中集成了快速回答和深度思考两种模式。该模型支持英语、韩语、西班牙语三种语言,具备智能工具使用能力,能处理12.8万字长文本,在数学推理和编程能力方面表现出色,甚至超越了许多更大规模的模型,为AI技术的实用化发展提供了新的解决方案。
    至顶网  科技行者  2025-07-22 13:21:43  
  • 被《抓娃娃》选中、与成龙合作,自学AI的我跨界影视圈

    自学AI绘画后,我接到了《抓娃娃》导演和成龙电影的邀请
    至顶网  杨淼  2024-10-08 10:31:18  
  • 英特尔谈“小芯片”革命与未来应用方向

    在2019年3月21日接受IEEE Spectrum采访时,她与我们共同就这一愿景以及英特尔公司的技术状况进行了探讨。
    至顶网  IEEE  2019-04-15 19:21:25  
  • ViStoryBench:一场可视化故事世界的大冒险——StepFun团队打造全面评估标准,帮你判断AI是否真懂讲故事

    ViStoryBench是一个全面的故事可视化评估基准,由StepFun团队打造,用于测试AI将文字故事转化为连贯图像序列的能力。它包含80个多样化故事和344个角色参考,评估包括角色一致性、提示遵循度等多个维度。研究测试了20多种方法,发现UNO在开源方法中表现最佳,而商业软件如豆包和GPT-4o在提示一致性方面表现突出。该基准为故事可视化研究提供了统一标准,推动这一领域的创新发展。
    至顶网  科技行者  2025-07-07 17:38:18  
  • 斯坦福哈佛联合研究:AI学习策略转换背后的"理性选择"机制

    斯坦福与哈佛研究团队通过创新的"层次贝叶斯框架",首次从理性分析角度解释了AI学习策略转换机制。研究发现AI会在"记忆型"和"理解型"两种策略间理性选择,转换规律遵循损失-复杂度权衡原理。该理论框架仅用三个参数就能准确预测AI在不同条件下的行为表现,为AI系统的可控性和可预测性提供了重要理论基础。
    至顶网  科技行者  2025-07-02 11:00:18  
  • AI在虚拟世界中的"英雄之旅":AIRI研究团队如何打造测试智能规划能力的全新战场

    AIRI研究团队开发了HeroBench测试平台,在RPG风格虚拟世界中评估25个大型语言模型的长期规划能力。研究发现AI在复杂多步骤规划任务中表现差异巨大,顶级模型Grok-4达到91.7%成功率,但加入升级机制和干扰因素后性能显著下降。该研究揭示了传统学术测试无法反映的AI规划能力真实水平,为改进AI长期规划提供了重要基准。
    至顶网  科技行者  2025-08-27 10:29:58  
  • 下一步视频推理:新加坡国立大学团队通过预测下一事件改进视频理解

    这项研究提出了"下一事件预测"作为培养视频AI时间推理能力的新方法。研究者将视频分为过去和未来部分,让AI预测未来事件,而不仅仅是描述所见。他们创建了V1-33K数据集(包含33,000个视频片段)和FutureBench测试基准,实验证明这种方法显著提升了模型的时间推理能力。研究发现,演绎推理(通过下一事件预测)比归纳推理(视频问答)和溯因推理(先前事件预测)更有效,简单的监督式微调就能取得良好效果,且增加数据量超过5K后效果提升不明显。
    至顶网  科技行者  2025-06-03 07:42:38  
  • IBM运用基础模型加生成式AI,展示开创性AI研究成果

    近期,OpenAI免费发布了最先进的生成式transformer模型ChatGPT。此子一经亮相便引发媒体的广泛关注与用户的真诚赞赏,再次凸显出人工智能的可观潜力。
    至顶网  至顶网计算频道  2023-02-14 15:57:00  
  • 视觉语言模型的"线性推理瓶颈"——爱沙尼亚塔林理工大学揭示AI视觉推理的隐藏障碍

    爱沙尼亚塔林理工大学研究团队发现,先进AI视觉模型的问题不在于"看不清"图片,而在于"想不通"图片间逻辑关系。他们提出"线性分离天花板"概念,揭示了广泛存在的"线性推理瓶颈"现象,并证明通过针对性微调可以解决这一问题。研究为改进AI视觉推理能力提供了新思路。
    至顶网  科技行者  2025-07-21 09:12:03  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号