用了 0.072003秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容1228 条
  • 波兰语言技术突破:Bielik v3小型模型如何以更少资源实现更强性能

    想象你正在选择一辆汽车。传统观念认为,想要强大的性能就必须购买大排量的豪华车型,但如今的技术让紧凑型车也能通过精巧的工程设计获得令人惊讶的动力和效率。这正是Bielik v3语言模型背后的理念。
    至顶网  科技行者  2025-05-13 12:25:15  
  • SynLogic:香港科技大学与MiniMax联合开发的逻辑推理数据集,让AI更懂得思考

    来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
    至顶网  科技行者  2025-05-31 17:26:54  
  • 机器人有了"第六感":首尔大学让AI机器人学会在不确定时"看仔细点,做慢点"

    首尔大学开发的SCALE技术让AI机器人具备了类似人类的"第六感",能够感知自身的不确定程度并据此调整观察和行动策略。这项技术无需额外训练即可集成到现有机器人系统中,在复杂环境下的任务成功率提升显著,代表了机器人从被动执行向智能适应的重要转变。
    至顶网  科技行者  2026-02-11 15:57:47  
  • 阿里团队推出DeepPHY:首个专门测试AI视觉模型物理推理能力的综合评估平台

    阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
    至顶网  至顶AI实验室  2025-08-13 15:16:57  
  • 英伟达联手斯坦福:一口气生成一分钟连贯视频,AI终于会讲故事了

    英伟达与斯坦福等顶尖机构联合开发的TTT技术首次让AI学会"讲故事",能生成长达一分钟的连贯视频。该技术采用"边做边学"的创新方法,让AI在生成视频时持续优化记忆能力,在人类评估中比现有最佳方法领先34个Elo积分,展现出革命性的长视频生成能力。
    至顶网  科技行者  2025-07-17 09:24:31  
  • 阿里巴巴推出DeepPHY:首个专门测试AI视觉模型物理推理能力的综合评估平台

    阿里巴巴团队推出DeepPHY,这是首个专门评估AI视觉语言模型物理推理能力的综合平台。通过六个不同难度的物理环境测试,研究发现即使最先进的AI模型在物理推理任务中表现也远低于人类,成功率普遍不足30%。更关键的是,AI模型虽能准确描述物理现象,却无法将描述性知识转化为有效控制行为,暴露了当前AI技术在动态物理环境中的根本缺陷。
    至顶网  科技行者  2025-08-12 14:18:56  
  • BlenderFusion:谷歌DeepMind让普通图片秒变3D魔法工场

    这项由谷歌DeepMind研究团队开发的BlenderFusion技术,实现了将普通2D照片转换为可精确编辑的3D场景的突破。该系统通过三步流程:物体分层提取、Blender 3D编辑、生成式合成,解决了传统图像编辑中控制精度与真实感之间的矛盾,支持多物体操作、材质修改、场景重组等复杂编辑任务。
    至顶网  科技行者  2025-07-01 15:52:58  
  • 华中科大团队破解AI网页设计痛点:让机器像人类一样"分块思考"生成代码

    华中科技大学研究团队开发的LaTCoder通过"分而治之"策略解决AI网页代码生成中的布局保持难题。该方法将复杂网页设计分割为小块,逐块生成代码后智能拼接,在多个评估指标上显著优于现有方法。团队还构建了更具挑战性的CC-HARD数据集,为行业提供了新的测试标准。这项技术有望大幅降低网页开发门槛,推动设计到代码的自动化转换。
    至顶网  科技行者  2025-08-11 11:05:52  
  • FullFront:探索跨越前端工程全流程的多模态大语言模型基准测试

    FullFront是一项创新研究,首次全面评估多模态大语言模型在前端工程完整流程(从设计概念化到视觉理解再到代码实现)中的能力。研究通过精心设计的基准测试,包括网页设计、网页感知问答和网页代码生成三大核心任务,发现即使最先进的模型在精细视觉感知(如元素对齐、大小和间距)方面表现远低于人类专家,且在复杂布局和交互功能实现上仍存在显著局限。研究揭示了闭源模型普遍优于开源模型,但所有模型与人类专业水平间仍存在巨大差距,为未来AI辅助前端开发工具的改进提供了重要方向。
    至顶网  科技行者  2025-05-29 10:24:54  
  • 新加坡国大团队重磅突破:让AI学会看直播解说,5百万视频打造史上最强实时视频评论员

    新加坡国立大学研究团队开发出革命性AI视频解说系统LiveCC,通过500万YouTube视频训练,实现0.5秒内实时生成视频解说。该系统在体育赛事解说质量上超越多个大型模型,在传统视频问答任务中也达到同规模最优性能,为AI实时多模态理解开辟新方向。
    至顶网  科技行者  2025-07-14 09:46:26  
  • Meta AI团队颠覆性突破:让机器像人类一样聪明地整合多个答案

    Meta AI团队开发的AggLM技术突破了传统AI多数投票的局限,通过强化学习训练模型学会智能聚合多个候选答案。在数学竞赛测试中,该技术将正确率从35%提升至50%,相比传统方法提升45%。AggLM不仅能选择正确答案,还能创造性地组合不同答案中的有用信息,展现了AI向人类专家级推理能力的重要进步。
    至顶网  科技行者  2025-09-28 13:47:12  
  • IBM前任CIO推动了一场引人注目的数字化转型

    作为CIO,我们的核心技能体现在解决问题上。解决问题的能力越强,CIO之路就会走得越顺遂。
    至顶网  Forbes  2020-04-14 10:38:30  
  • 南卫理公会大学发现:ChatGPT背后的注意力机制为何如此强大——从递归神经网络视角破解Softmax注意力的表达力之谜

    南卫理公会大学研究团队通过递归神经网络视角重新解析Softmax注意力机制,发现其可分解为无穷多个递归网络的叠加,每个网络捕捉不同阶数的特征交互。研究证明线性注意力仅为Softmax的一阶近似,缺乏高阶交互能力,并发现Softmax分母可用简单向量归一化替代,为优化AI计算效率提供新思路。
    至顶网  科技行者  2025-08-06 11:12:35  
  • 颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR

    颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR
    至顶网  至顶AI实验室  2025-07-17 17:24:04  
  • 自动驾驶汽车如何学会"反省"?清华和理想汽车联手打造会思考的AI司机

    清华大学和理想汽车联合开发的ReflectDrive系统,首次为自动驾驶引入"反省机制",让AI司机具备自我纠错能力。通过将驾驶空间离散化和两阶段路径生成,系统能在规划路径后主动检查安全性,发现问题时智能修正。在NAVSIM基准测试中,该系统综合得分达91.1分,接近人类驾驶水平,为自动驾驶安全性和智能化开辟了新路径。
    至顶网  科技行者  2025-10-16 15:12:21  
  • 每年撬动4000亿元投资,东数西算新基建需要新存储

    继南水北调、西电东送之后,又一超级工程——东数西算全面启动,数据存储产业有望获益。
    至顶网  业界供稿  2022-03-15 17:38:33  
  • 中文AI内容审核新突破:打造更智能的网络安全守护者

    这项由浙江大学、腾讯和新加坡国立大学联合完成的研究,针对中文网络有害内容检测的难题,创建了首个专业标注的中文有害内容检测基准数据集ChineseHarm-Bench,涵盖博彩、色情、谩骂、诈骗、违法广告等六大类别。研究团队提出了知识增强的训练方法,通过结合人工标注规则和大模型隐性知识,让小型模型达到与顶级大模型相当的检测性能,为中文网络环境提供了更高效、更经济的安全检测解决方案。
    至顶网  科技行者  2025-06-18 09:53:48  
  • 多伦多大学团队发明神奇"洗牌法",让AI画画更精美,不用额外训练就能生成超逼真图像

    这项由多伦多大学等机构联合完成的研究提出了令牌扰动引导(TPG)技术,通过"洗牌"操作改进AI图像生成质量。该方法无需额外训练即可显著提升图像生成效果,在无条件生成中质量指标提升近2倍,条件生成中接近最先进CFG技术的表现。TPG具有即插即用、通用性强的特点,为AI图像生成技术发展提供了新思路。
    至顶网  科技行者  2025-06-18 10:45:08  
  • EgoZero:从智能眼镜到机器人学习的零数据迁移革命

    这项研究介绍了EgoZero,一种创新的机器人学习系统,能够仅通过Project Aria智能眼镜捕获的人类示范数据,训练出零样本迁移的机器人操作策略。研究团队提出了一种形态无关的状态-动作表示方法,使用点集来统一人类和机器人数据,并开发了从原始视觉输入中提取准确3D表示的技术。在没有任何机器人训练数据的情况下,EgoZero在7种真实世界操作任务上实现了70%的成功率,展示了强大的泛化能力,为解决机器人学习中的数据瓶颈问题提供了新思路。
    至顶网  科技行者  2025-05-30 11:18:05  
  • 让机器听懂"你说我说":布尔诺理工大学如何破解多人对话识别难题

    布尔诺理工大学研究团队开发了DiCoW和DiariZen两个系统,用于解决多人对话中的语音识别难题。该系统巧妙结合说话人分离与语音识别技术,在国际挑战赛中获得第二名,能处理15种语言的对话场景。研究发现系统具备良好的跨语言泛化能力,即使主要用英语训练也能处理其他语言。团队已开源相关模型,为会议记录、多语言交流等实际应用提供了强大工具。
    至顶网  科技行者  2025-06-25 09:35:58  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号