搜一下
用了 0.119060秒,为您找到
北京
pk
精准
人工
计划
软件
網纸
YB233
相关内容12590 条
苹果公司的AXLearn:让AI巨型模型训练变得像搭积木一样简单
苹果公司研究团队开发了AXLearn,一个模块化的大型AI模型训练系统。该系统采用严格的组件封装设计,能在GPU、TPU、Trainium等异构硬件上运行,将添加新功能的代码量从数百行减少到10行,实现了常数级的复杂度增长。研究团队创造了"代码行复杂度"指标来量化模块化优势,并通过大规模实验证明了系统的高性能和扩展性。
至顶网
科技行者 2025-07-18 09:33:29
浙江大学团队发布OS Agents全景调研:让AI助手像钢铁侠贾维斯一样操控电脑手机
这项由浙江大学等多家机构联合完成的大规模调研首次系统性梳理了操作系统智能体这一前沿领域,全面分析了基于多模态大语言模型的AI助手如何像人类一样操作电脑手机。研究涵盖了技术架构、训练方法、评估体系和发展挑战,为实现类似贾维斯的智能数字助手提供了完整的技术路线图。
至顶网
科技行者 2025-08-13 14:35:46
清华大学和智谱AI联手打造355B参数超级AI大脑:GLM-4.5如何在推理、编程和智能代理三个关键领域同时称王
清华大学和智谱AI联合发布GLM-4.5系列模型,这是首个在推理、编程和智能代理三大核心领域同时达到顶尖水平的开源AI模型。GLM-4.5拥有355B参数但仅激活32B,创新的混合推理模式能根据任务复杂度自动选择思考深度。该模型在12项基准测试中排名第三,智能代理任务排名第二,已完全开源供研究使用。
至顶网
科技行者 2025-08-13 10:57:51
微软亚洲研究院发布HeurAgenix:让AI自己学会解决超级难题的全新框架
微软亚洲研究院发布HeurAgenix框架,首次实现让大型语言模型自动进化和选择算法来解决组合优化难题。该系统通过对比学习机制让AI自主发现改进策略,并开发轻量级选择模型在保持性能的同时大幅降低成本。在五大经典问题测试中表现卓越,为传统需要专家手工设计的优化问题提供了自动化解决方案。
至顶网
科技行者 2025-07-01 12:18:00
伊利诺伊大学团队突破手机视频重建难题:不需要额外传感器,仅凭摄像头就能完美还原动态场景
伊利诺伊大学团队开发出ROS-Cam系统,仅需普通RGB视频即可精确重建动态三维场景,无需激光雷达等额外传感器。该技术通过补丁式追踪过滤器、异常值感知优化和两阶段策略,在多个数据集上超越现有方法,处理速度提升2-12倍。这项突破有望让普通用户轻松创建专业级三维内容,在电商、教育、文化保护等领域具有广阔应用前景。
至顶网
科技行者 2025-10-09 12:20:08
破解
软件
开发的秘密:中科院团队让AI像真正的程序员一样工作
这项研究提出了SWE-Flow框架,通过测试驱动开发方法自动生成AI编程训练数据。研究团队从真实GitHub项目中构建运行时依赖关系图,将复杂开发任务分解为循序渐进的步骤,生成了16061个训练实例。实验表明,使用该数据训练的AI模型在
软件
开发任务上表现显著提升,为AI编程能力提升提供了新思路。
至顶网
科技行者 2025-06-16 14:07:19
阿里巴巴团队发布GUI-Owl:让AI像人类一样操作电脑和手机的智能助手
阿里巴巴团队发布了GUI-Owl智能助手,这是一个能够像人类一样操作电脑和手机界面的AI系统。该系统通过自进化数据生产、多样化能力构建和强化学习训练,在多项测试中超越现有模型,配合Mobile-Agent-v3多智能体框架可达到73.3%的任务成功率,为GUI自动化领域带来重大突破。
至顶网
科技行者 2025-08-29 09:31:31
上海交通大学团队重磅发布:让AI真正读懂整个代码仓库,这次不再只是看片段了
上海交通大学团队构建了SWE-QA仓库级代码问答基准测试,包含576个高质量问答对,评估AI理解整个代码库而非片段的能力。研究开发了SWE-QA-Agent智能代理系统,通过迭代推理和多工具协作回答复杂代码问题。实验显示Claude 3.7 Sonnet表现最佳,AI在概念性问题上表现良好但在需要深度推理的定位问题上仍有挑战。
至顶网
科技行者 2025-10-15 12:06:00
当AI变身全能艺术家:Adobe研究院如何用"掩码扩散"革命多模态智能
Adobe研究院联合UCLA开发的Lavida-O系统,首次在单一AI模型中实现图像理解、生成、编辑的完美统一。采用创新的掩码扩散技术,该系统不仅生成速度比传统方法快6.8倍,还具备规划和反思能力,能像真正的艺术家一样思考和创作,在多项权威测试中超越现有最佳模型。
至顶网
科技行者 2025-10-15 08:36:40
我在一汽看到了“一个AI车企是如何炼成的”
AI不仅在重新定义汽车,还在定义汽车整个上下游。
至顶网
高飞 2025-09-12 22:12:09
IBM THINK演讲实录 | IBM总裁Jim Whitehurst:利用混合云加速规模创新
Jim Whitehurst于IBM Think Digital 大会上的主题演讲全文。
至顶网
至顶网云计算频道 2020-05-12 14:34:54
台湾大学联合MediaTek和Nvidia突破性成果:让AI自己教自己说话识别,语音识别准确率提升55%
台湾大学联合MediaTek和Nvidia的研究团队开发了一种突破性的语音识别自我改进框架,无需大量
人工
标注数据即可显著提升AI语音识别准确率。该方法通过让AI生成伪标签训练语音合成系统,再用合成语音反向训练识别模型,形成自我强化循环。在台湾国语测试中,新模型Twister比原版Whisper错误率降低20-55%,数据效率提升10倍以上,为低资源语言AI应用提供了新路径。
至顶网
科技行者 2025-06-19 10:47:53
滑铁卢大学让AI智能体学会使用工具:突破性框架将改变机器学习训练方式
滑铁卢大学研究团队开发了VerlTool框架,突破了AI模型无法使用外部工具的限制。该框架通过异步执行和模块化设计,让AI智能体能在多轮交互中学会使用各种工具,实现了从"孤立思考"到"协作解决问题"的重大转变,在六个领域的测试中都展现了卓越性能,为AI发展开启了新的可能性。
至顶网
科技行者 2025-09-24 13:54:50
福布斯2019年AI技术发展预测,我们整理出35条核心发言
来自35位参与AI项目的高层管理人员的观点,他们一直密切关注AI领域的发展动向,并承诺构建起少炒作、高实用度、更准确且针对性更强的AI方案。
至顶网
科技行者 2018-12-17 17:24:03
AI视频生成新突破:天工AI让你用几张照片就能拍出好莱坞大片
天工AI推出的SkyReels-A2视频生成系统实现了重大突破,能够将多张不相关照片智能组合成高质量视频。该技术采用双分支架构处理语义和空间信息,通过200万训练样本学习元素组合规律。在与商业模型的对比中表现出色,特别是在物体一致性和视觉质量方面领先。该系统已开源,为创意产业、教育培训、虚拟电商等领域带来革命性应用前景。
至顶网
科技行者 2025-07-14 09:49:31
当AI学会"察言观色":卡内基梅隆等高校如何让盲人用户重新掌控自动化选择权
卡内基梅隆大学等机构研究团队开发了名为Morae的智能界面助手,专门解决盲人用户在使用AI自动化工具时失去选择权的问题。通过"动态模糊选择验证"机制,Morae能在关键决策点主动暂停询问用户偏好,而非自动替用户选择。用户研究显示,相比传统AI助手,Morae帮助用户做出了更多符合个人偏好的选择,显著提升了用户满意度和控制感。
至顶网
科技行者 2025-09-05 10:13:39
《数字经济洞察周报》2023年第26期 | 2023世界机器人大会在京举办,发布多项重要成果
2023世界机器人大会在京举办,发布多项重要成果
至顶网
孙硕 2023-12-07 15:22:27
AlphaGo对局李世石两周年纪:AI程序攻克围棋的算法秘密
我们将详细介绍AlphaGo是什么以及它的工作原理。
至顶网
科技行者 2018-03-16 20:34:04
新加坡国立大学重磅报告:AI学术会议正走向崩溃边缘!
新加坡国立大学研究团队通过数据分析揭示,当前AI学术会议面临四大危机:研究人员年均发表超过4.5篇论文、会议碳排放超过主办城市日排放量、71%相关讨论呈负面情绪、会场容量不足需抽签限制参与。研究提出社区联邦会议模式,将传统集中式会议分解为全球评议系统、地区小型中心和数字协作平台三层架构,以实现可持续的学术交流。
至顶网
科技行者 2025-08-11 11:03:15
音乐创作新革命:上海AI实验室让你只需输入歌词就能生成完整歌曲
上海AI实验室等机构联合开发的SongGen系统实现了AI音乐生成的重大突破,能够在单一阶段同时生成人声和伴奏,用户只需输入歌词和描述就能创作完整歌曲。该系统提供混合和双轨两种生成模式,支持语音克隆功能,在多项评估中超越传统多阶段方法。研究团队还构建了包含54万样本的开源数据集,并将完整代码和数据公开发布,为AI音乐创作的民主化奠定基础。
至顶网
科技行者 2025-10-10 10:30:23
<
上一页
621
622
623
624
625
626
627
628
629
630
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号