用了 0.011435秒,为您找到大发 导师 分享 稳赢 计划 罔芷 88pkee 驻测相关内容669 条
  • MiniCPM4:小身材大能量,OpenBMB团队让AI模型跑进手机时代

    OpenBMB团队推出MiniCPM4,通过稀疏注意力、高质量数据处理等四大创新维度,实现8B参数模型仅用22%训练数据达到竞争对手性能,并在端侧设备上实现7倍推理加速。该研究涵盖InfLLM v2架构、UltraClean数据技术、ModelTunnel v2训练优化和CPM.cu推理系统,展示了端侧AI的巨大潜力。
    至顶网  科技行者  2025-06-12 13:06:39  
  • Skywork AI团队:一个1.5B参数的小模型如何同时掌握图像理解、生成和编辑三项绝技

    Skywork AI团队开发出参数仅1.5亿的统一多模态模型Skywork UniPic,能同时完成图像理解、文字生成图像和图像编辑三项任务。该模型采用创新的双编码器架构,在多个基准测试中达到先进水平,且能在消费级硬件上运行,为多模态AI的普及化应用提供了新方案。
    至顶网  科技行者  2025-08-08 11:54:22  
  • Meta AI研究院重新定义人工智能视觉理解:DINOv3让机器拥有堪比人眼的识别能力

    Meta AI研究院开发的DINOv3是一项革命性的自监督学习视觉模型,通过观察16.89亿张未标注图片学会理解图像。该模型采用创新的Gram锚定技术解决大规模训练难题,在目标检测、图像分割、深度估计等多个任务上达到业界最高水平,并成功应用于卫星遥感、医学影像等专业领域,为人工智能视觉理解能力的发展开辟了新路径。
    至顶网  科技行者  2025-10-10 10:31:18  
  • 香港大学团队打造"机器人眼中的世界":让AI学会像人类一样探索和思考

    香港大学团队开发了EmbRACE-3K数据集,专门训练AI系统在复杂环境中进行推理和行动。该数据集包含超过3000个任务和26000个决策步骤,每步都有详细的推理标注。实验显示,现有先进AI模型在需要主动探索和环境交互的任务中表现不佳,成功率低于20%,但经过专门训练后性能显著提升。这项研究为开发更智能的服务机器人和自动驾驶系统提供了重要技术基础。
    至顶网  科技行者  2025-07-22 09:25:53  
  • FlowReasoner:新加坡Sea AI Lab团队让AI智能体系统实现"一人一策"的突破性研究

    这是由新加坡Sea AI Lab等机构联合完成的突破性研究,提出了FlowReasoner查询级元智能体系统。该系统能为每个用户查询定制专门的多智能体解决方案,突破了传统"一套方案解决一类问题"的局限。通过推理能力结合外部执行反馈的强化学习,在多个代码生成基准上综合准确率达81.89%,相比o1-mini提升10.52%,代表了AI系统从标准化向个性化发展的重要转折。
    至顶网  科技行者  2025-07-15 10:02:07  
  • 香港大学团队发布600万张图像的AI绘画推理数据集:让AI像人类一样"想象"后再创作

    香港大学团队发布史上最大规模AI绘画推理数据集FLUX-Reason-6M,包含600万张高质量图像和2000万条双语描述,耗费15000个GPU天计算资源。首创"生成链式思维"训练法,让AI学会像人类艺术家般思考创作过程。同时推出PRISM-Bench测评标准,对19个先进模型评测显示闭源模型仍领先,但所有模型在文字渲染等复杂任务上都有改进空间。
    至顶网  科技行者  2025-09-12 16:49:17  
  • 让AI像小孩玩游戏一样学会数学推理:约翰斯·霍普金斯大学研究团队的惊人发现

    约翰斯·霍普金斯大学研究团队发现让AI通过玩贪吃蛇等简单游戏进行强化学习训练,竟能显著提升其在数学推理等完全不同任务上的表现。这种名为ViGaL的训练方法无需任何数学训练数据,却在多项测试中超越了专门用数学题目训练的AI模型,展现了游戏训练培养通用推理能力的巨大潜力。
    至顶网  科技行者  2025-06-13 09:45:19  
  • Kimi团队发布K1.5:让AI像人类一样"边思考边学习"的突破性进展

    Kimi团队发布的K1.5模型通过强化学习实现突破,让AI学会长链条思考和多模态推理。在数学、编程等测试中表现卓越,AIME得分77.5,MATH-500达96.2分,与OpenAI o1相当。创新的"长转短"技术让AI既能深度推理又能简洁回答,为AI智能化发展提供新思路。
    至顶网  科技行者  2025-09-19 10:04:51  
  • Moonshot AI发布Kimi-VL:仅用3B参数就能媲美大型AI的超级视觉模型

    Moonshot AI发布了新一代视觉语言模型Kimi-VL,该模型采用混合专家架构,仅用2.8B激活参数就能媲美大型模型性能。其创新包括原生分辨率视觉编码器、128K长上下文处理能力和长链思考推理机制。在多项基准测试中,Kimi-VL在数学推理、文档理解、智能体任务等方面表现出色,证明了小参数高效能的设计理念,为AI技术的普及和可持续发展提供了新思路。
    至顶网  科技行者  2025-07-17 09:28:25  
  • 北卡罗来纳大学教堂山分校:AI智能体终于学会了"举一反三"——像人类一样从失败中提炼技能

    北卡罗来纳大学教堂山分校等机构的研究团队开发出SKILLRL框架,让AI智能体首次具备了类似人类的经验学习能力。该系统能够从成功和失败的经验中提炼可复用技能,建立分层技能库,并在训练过程中实现自我进化。实验显示,SKILLRL在复杂任务中的成功率比传统方法提升超过15%,同时大幅减少了计算资源消耗,为构建更智能的AI系统开辟了新路径。
    至顶网  科技行者  2026-02-11 15:54:48  
  • 超越"健忘症"的AI:腾讯团队让机器拥有了"侦探级"推理记忆力

    腾讯微信AI团队开发的ComoRAG系统通过模仿人脑认知机制,让AI具备了动态记忆和循环推理能力,在长文本理解任务上相比传统方法准确率提升高达11%。该系统采用三层知识组织结构和五步认知循环过程,能够像侦探破案一样主动探索线索、整合信息、构建完整推理链条,特别在处理复杂叙事推理问题时表现优异,标志着AI从信息检索工具向智能推理伙伴的重要转变。
    至顶网  科技行者  2025-08-26 14:19:26  
  • 沙特32B医疗AI突破:Gazal-R1凭借双阶段训练击败12倍大模型

    沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
    至顶网  科技行者  2025-07-01 15:53:37  
  • StepFun发布Step-Audio 2:让AI像人类一样自然对话,首个真正懂"言外之意"的语音助手

    StepFun团队发布了突破性语音AI系统Step-Audio 2,这是首个真正实现端到端语音对话的模型,能直接处理语音而无需文字转换。该系统不仅能理解语言内容,还能感知情绪、语调等副语言信息,并用自然的语音回应。通过8百万小时语音数据训练,在多项测试中超越GPT-4o等商业系统,代表了人机交互技术的重大进步。
    至顶网  科技行者  2025-07-28 10:58:19  
  • 当3D建模遇上一秒魔法:腾讯华为联手打造的FlashVDM技术如何让3D创作"飞起来"

    这项由腾讯混元实验室联合多所知名大学完成的研究,成功将3D模型生成时间从30多秒压缩到不到1秒,实现32倍速度提升。该技术通过创新的渐进式流程蒸馏和闪电向量解码器,在保持生成质量的同时大幅提升了效率,为游戏开发、建筑设计、影视制作等领域带来革命性改变,使3D内容创作从专业技能变成人人可用的日常工具。
    至顶网  科技行者  2025-07-31 09:57:03  
  • 机器人终于会"想"再"动"了——艾伦人工智能研究院的MolmoAct模型让机器人拥有空间推理能力

    艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。
    至顶网  科技行者  2025-08-14 10:29:17  
  • 蒙彼利埃大学团队破解AI视觉模型"看错重点"难题:让机器真正学会专注于正确区域

    这项由法国蒙彼利埃大学团队开发的iFAM系统,通过创新的两阶段设计解决了AI视觉模型"看错重点"的问题。系统第一阶段识别图像中的关键区域,第二阶段只处理被选中的区域,完全屏蔽背景干扰。在多个挑战性数据集上的实验表明,该方法显著提升了模型对虚假关联的抗性,为医疗诊断、自动驾驶等高风险应用提供了更可靠的技术基础。
    至顶网  科技行者  2025-06-19 10:47:20  
  • 圣母大学团队发布史上最全面大语言模型跨学科应用报告:从历史哲学到生物工程,AI如何重塑13个学术领域

    圣母大学研究团队发布了迄今最全面的大语言模型跨学科应用调研报告,系统梳理了AI在人文、商业、科学工程等13个领域的应用现状。研究发现,大语言模型在文本处理和模式识别方面表现优异,但在创造性思维和价值判断上仍有局限。报告强调人机协作是未来发展方向,并为不同需求用户提供了具体的模型选择建议。
    至顶网  科技行者  2025-10-15 10:08:39  
  • NVIDIA发布Cosmos-Reason1:让AI拥有物理常识和身体推理能力的突破性研究

    NVIDIA团队开发的Cosmos-Reason1是首个专门针对物理推理的多模态AI系统,通过创新的训练方法让AI具备了理解物理世界和进行具身推理的能力。该系统包含70亿和560亿参数两个版本,采用物理AI监督微调和强化学习两阶段训练,在物理常识和具身推理评测中显著超越现有模型,为机器人、自动驾驶等应用奠定重要技术基础。
    至顶网  科技行者  2025-07-31 11:28:01  
  • YC加速器掌门人Gary Tan深度对话:下一代AI独角兽的逻辑变了,先去大厂再创业的时代已成往事,那里只是高智商人群的托儿所?

    AI正在彻底改写创业规则:YC最新数据显示,10人团队12个月达成千万美元营收已成常态,"氛围编程"让技术不再是瓶颈,而创始人能否深度理解客户需求成为成败关键。当6人团队就能创造八位数收入时,我们看到的不仅是速度革命,更是对公司本质的重新定义。
    至顶网  高飞的电子替身  2025-05-28 10:55:00  
  • 让AI炒股变得更聪明:哈佛大学等团队发明的"智能交易员"如何用对话模式赚钱

    这是一项融合大语言模型与强化学习的金融交易AI创新研究。哈佛等知名院校团队开发的FLAG-TRADER系统让仅1.35亿参数的小型AI模型在股票和加密货币交易中超越了GPT-4等大型商业模型。该系统通过部分微调和夏普比率奖励机制,实现了既能理解复杂市场信息又能从交易实践中持续学习的智能交易决策,为AI在金融领域的应用开辟了新路径。
    至顶网  科技行者  2025-08-20 18:05:38  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号