用了 0.032819秒,为您找到大发 大小 单双 有人 带么罔芷 88pkee 驻测相关内容2143 条
  • 多模态通才:InfantAgent-Next如何让AI更智能地操作你的电脑

    InfantAgent-Next是一款突破性的多模态通用型AI助手,能通过文本、图像、音频和视频与计算机进行交互。不同于现有方法,它采用高度模块化架构,将基于工具和纯视觉的代理技术融为一体,让不同模型能逐步协作解决分散任务。在OSWorld视觉测试中达到7.27%的准确率,超越Claude-Computer-Use;同时在代码处理基准SWE-Bench和通用任务平台GAIA上也表现出色。其开源设计不仅提供了丰富工具集,还优化了鼠标点击定位和文件编辑功能,为AI自动操作计算机开创了新范式。
    至顶网  科技行者  2025-05-29 14:49:59  
  • 颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR

    颠覆式创新还是学术诈骗?韩科院联名谷歌发布新模型架构MoR
    至顶网  至顶AI实验室  2025-07-17 17:24:04  
  • Hugging Face团队推出SmolLM2:小而精的语言模型如何在大模型时代找到自己的位置

    Hugging Face团队发布SmolLM2语言模型研究报告,详细阐述了17亿参数小型模型的创新训练方法。该研究通过多阶段精细化训练策略和三个全新数据集(FineMath、Stack-Edu、SmolTalk)的创建,证明了小模型在数据质量优化下可达到优异性能。模型在多项基准测试中超越同规模竞品,为人工智能技术的普及化和可持续发展提供了新的技术路径。
    至顶网  科技行者  2025-08-26 12:03:38  
  • 中国科大推出VAREdit:让AI图片编辑变得又快又准的神器

    中国科大联合HiDream.ai推出的VAREdit是首个基于视觉自回归模型的图像编辑系统,通过多尺度预测和尺度对齐参考模块,实现了比传统扩散模型更精准快速的编辑效果。在标准测试中,VAREdit的编辑质量比最强竞争对手提升30%以上,处理速度快2.2倍,能在1.2秒内完成高质量图像编辑,为AI图像处理领域开辟了全新的技术路径。
    至顶网  科技行者  2025-08-29 09:32:37  
  • AI模型学会"深度思考":马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

    马里兰大学团队开发了名为Huginn的新型AI架构,通过让3.5B参数的小模型学会"深度思考",在推理任务上达到了50B参数大模型的性能水平。该模型采用循环深度设计,可根据问题复杂度进行1-64轮思考,在数学推理和编程任务中表现出色。这项突破证明了通过优化思考过程而非单纯增加参数规模来提升AI能力的可行性,为更高效、经济的AI发展开辟了新路径。
    至顶网  科技行者  2025-08-26 12:00:26  
  • 区块链与加密货币34个权威术语

    这是一份由大量区块链术语组成的词汇表,你可以借此将各类理念与定义串联起来,从而更充分地参与到区块链讨论当中。这份词汇表包含Flipside Crypto发布的关于区块链与加密货币的内容。
    至顶网  科技行者  2018-08-30 11:55:43  
  • 预言下一代操作系统

    操作系统的英文简称是OS,Operating System,在超越单一终端、超越单一操控的理念下,而下一代操作的设计哲学将可能被定义为ODS,On Demand System(按需系统),并最终向进化至 “所想即所得”做出准备。
    至顶网  赛博故事(cybergushi)  2019-08-26 15:13:20  
  • 全方位保护:华盛顿大学与微软联合开发的OMNIGUARD,一种跨模态AI安全防护的高效方法

    这项由华盛顿大学和微软联合开发的OMNIGUARD研究,提出了一种高效的AI安全检测方法,能够跨越语言和模态(文本、图像、音频)识别有害内容。该方法通过发现大型语言模型内部的通用表示,构建轻量级分类器,比现有方法准确率高出11.57%-20.44%,同时速度提升约120倍。OMNIGUARD在73种语言和多种模态攻击测试中表现出色,展示了极高的数据效率和适应性,为AI系统安全防护提供了重要突破。
    至顶网  科技行者  2025-06-05 10:25:45  
  • 斯坦福大学突破:AI能否像人类一样判断创意写作的好坏?

    斯坦福大学研究团队创建了全球首个创意写作评估基准LitBench,通过分析Reddit写作社区的4万多对故事比较数据,训练AI模型判断创意写作质量。研究发现专门训练的小型奖励模型(78%准确率)能超越大型语言模型评委(73%),但添加推理链反而降低了表现,揭示了创意评判需要直觉性判断的特点。
    至顶网  科技行者  2025-07-11 09:48:53  
  • RICE:DeepGlint推出让AI能像人类一样精准"看懂"图片细节的新方法

    DeepGlint等机构联合发布RICE方法,通过区域感知聚类判别技术显著提升AI的图像细节理解能力。该方法构建了包含20亿区域的大规模数据集,设计了统一的物体识别和文字识别学习框架,在多项任务上超越现有主流模型,特别是在OCR和精细视觉理解方面表现突出,为多模态AI应用提供了更强大的视觉基础。
    至顶网  科技行者  2025-08-05 10:32:56  
  • 英特尔软硬件协同,加速DeepRec在阿里巴巴AI业务场景落地

    英特尔自2019年以来就与阿里巴巴 PAI团队紧密合作,将英特尔人工智能(Artificial Intelligence,AI)技术应用到DeepRec中,针对算子、子图、runtime、框架层和模型等多个层面进行优化,以充分发挥英特尔软硬件优势,助力阿里巴巴加速内外部AI业务性能。
    至顶网  业界供稿  2022-07-01 14:41:18  
  • 蚂蚁集团揭秘:大模型如何"读心术"般理解用户行为?注意力机制的华丽变身

    蚂蚁集团研究团队开发了梯度引导软掩码技术,解决大语言模型在用户行为理解方面的局限性。该技术通过自适应调节注意力机制,让模型从局部关注平滑过渡到全局理解。在支付宝1.4亿用户数据上的实验显示,这种方法在9项用户认知任务上均取得最佳表现,0.5B参数的专用模型甚至超越了8B参数的通用模型,为个性化服务和用户理解提供了新的技术路径。
    至顶网  科技行者  2026-02-13 08:31:05  
  • SSR:通过推理引导式空间理解增强视觉语言模型的深度感知能力

    SSR是西湖大学研究团队开发的创新框架,通过引入深度感知增强视觉语言模型的空间理解能力。该方法将原始深度数据转换为结构化的推理语言,作为中间表示,显著提升空间推理能力。研究团队还创建了包含超过百万级的SSR-COT数据集和SSRBENCH评估基准。实验表明,SSR无需重新训练现有模型即可提供显著性能提升,在空间任务上最高改进22.5个百分点,为机器人和计算机视觉领域开创了新的可能性。
    至顶网  科技行者  2025-05-26 08:13:18  
  • LLM聊天机器人学会了察言观色:希伯来大学突破性研究让AI懂得何时说话

    这个突破意味着,未来的AI助手将不再是被动的问答机器,而是能够主动、适时地参与人类对话的智能伙伴。
    至顶网  至顶AI实验室  2025-06-19 16:21:44  
  • 把1568个字符塞进一个向量再完美复原:AIRI实验室发现AI记忆力的惊人极限

    这项由俄罗斯AIRI实验室主导的突破性研究发现,AI模型的单个记忆向量能够完美压缩和复原多达1568个文本片段,压缩比达到1500倍。研究测试了14个不同模型,揭示了AI系统巨大的未开发记忆潜力,但当前利用率仅30%。这一发现不仅挑战了对AI记忆机制的传统认知,更为未来更高效的AI系统设计开辟了新方向,有望让AI助手拥有更强的长期记忆和信息处理能力。
    至顶网  科技行者  2025-10-11 09:56:01  
  • Prot2Token:通过下一个标记预测统一蛋白质建模的全新框架

    Prot2Token是密苏里大学研究团队开发的一种突破性蛋白质建模框架,它通过将各种蛋白质预测任务转化为统一的下一个标记预测问题,解决了传统方法需要为不同任务开发专门模型的限制。这个框架以自回归解码器为核心,配合预训练蛋白质编码器和任务标记引导,实现了从蛋白质序列到结构、功能和相互作用的多样化预测。实验证明其性能媲美甚至超越专门方法,并在结构预测上比AlphaFold2快1000倍。Prot2Token通过多任务学习促进了不同预测任务间的协同效应,为蛋白质研究提供了高效、通用的计算范式。
    至顶网  科技行者  2025-06-03 09:46:56  
  • 西安交通大学团队新突破:让AI推理快一倍准一倍的"动量不确定性"方法

    西安交通大学等机构研究团队提出MUR方法,通过"动量不确定性"概念让AI推理系统学会轻重缓急,在节省50%以上计算资源的同时提升0.62-3.37%的准确率。该方法从物理学动量概念获得灵感,能够识别关键推理步骤并选择性地分配计算资源,解决了AI推理中的"过度思考"问题,为提高AI系统效率开辟了新路径。
    至顶网  科技行者  2025-07-29 17:14:49  
  • 香港科技大学团队突破:让AI像真正的设计师一样,一步步"拼积木"创造3D世界

    香港科技大学团队开发了名为CoPart的革命性3D生成技术,它模仿人类设计师的工作方式,将复杂3D物体分解为多个部件分别生成再组装。该技术采用双重编码策略和相互指导机制,确保各部件既精细独立又协调统一。研究团队还构建了包含91000个部件的大规模数据集PartVerse。实验显示CoPart在生成质量上显著优于传统方法,并支持部件编辑、关节物体生成等多种应用,为3D内容创作开辟了新方向。
    至顶网  科技行者  2025-07-21 11:30:41  
  • 推理模型存在崩溃缺陷?Open Philanthropy研究人员提出AI推理能力评估的改进方法

    推理模型存在崩溃缺陷?Open Philanthropy研究人员提出AI推理能力评估的改进方法
    至顶网  至顶AI实验室  2025-06-19 14:48:25  
  • 多模态专家混合模型的智能助理:约翰霍普金斯大学团队让AI在测试时自动调整专家选择,性能媲美更大模型

    约翰霍普金斯大学团队提出R2-T2方法,通过测试时动态调整专家权重让多模态AI更智能。该技术无需重训练就能让7B小模型性能超越34B大模型,在视觉问答等9个基准测试中取得显著提升。核心思路是让AI在遇到新任务时自动寻找相似成功案例并模仿其专家选择策略。
    至顶网  科技行者  2025-08-22 10:00:07  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号