用了 0.131547秒,为您找到网赌 长期 盈利 方法 罔芷 88pkee 驻测相关内容9380 条
  • LoRAShop:训练自由的多概念图像生成与编辑突破

    LoRAShop是弗吉尼亚理工大学研究团队开发的突破性框架,首次实现了无需额外训练的多概念图像编辑。该技术通过在整流流变换器中识别概念特定区域,创建分离的潜在掩码,并仅在相应区域混合LoRA权重,有效解决了"LoRA交叉干扰"问题。实验证明,LoRAShop在身份保留、多主体融合和实时编辑方面优于现有方法,为个性化图像创作开辟了新途径。
    至顶网  科技行者  2025-06-03 16:59:52  
  • 2025年数据中心硬件:变革与影响解析

    本文探讨了五大关键趋势将在2025年塑造数据中心硬件行业。从AI加速器和数据处理单元的投资增长,到先进冷却技术的扩大应用,以及对硬件安全风险的关注和Arm服务器的潜在兴起,这些创新将推动效率提升和性能优化,为现代计算的关键系统提供强大支持。
    至顶网  DataCenterKnowledge  2025-01-10 10:13:43  
  • WINA:微软推出权重感知神经元激活技术,让大语言模型推理速度提升60%以上

    WINA是一种由微软等机构研究人员开发的训练无关稀疏激活框架,它通过同时考虑隐藏状态大小和权重矩阵的列式l2范数来加速大型语言模型推理。与仅基于隐藏状态选择神经元的现有方法不同,WINA能更精确识别影响模型输出的关键神经元,在理论上提供更紧的误差界限。实验证明,WINA在相同稀疏度下比最先进方法表现更优(提升最多2.94%),同时减少高达65%的计算量,为资源受限环境中部署大型语言模型提供了高效解决方案。
    至顶网  科技行者  2025-05-29 15:53:39  
  • Contextual AI 新模型在准确性方面超越 GPT-4o — 这意味着什么

    Contextual AI今天发布了其基础语言模型(GLM),声称在行业中提供了最高的事实准确性,超越了Google、Anthropic和OpenAI的领先AI系统,在一个关键的真实性基准测试中表现出色。该公司由检索增强生成(RAG)技术的先驱创立,GLM在FACTS基准测试中获得了88%的事实得分,而Google的Gemini 2.0 Flash为84.6%,Anthropic的Claude 3.5 Sonnet为79.4%,OpenAI的GPT-4o为78.8%。
    至顶网  VentureBeat  2025-03-05 09:45:03  
  • 别被表面现象迷惑:如何真正衡量大语言模型的自我偏好

    这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
    至顶网  科技行者  2025-06-07 17:01:38  
  • 新技术帮助大语言模型控制思维链长度,在不增加计算成本的情况下优化推理能力

    研究人员提出了一种名为长度控制策略优化(LCPO)的训练技术,可以让开发者更好地控制大语言模型的思维链长度。这种方法通过在训练过程中引入长度约束,使模型能够在保持准确性的同时生成更简洁的推理过程。实验表明,采用LCPO训练的模型在准确性和成本之间提供了平滑的权衡,并且在相同推理长度下可以超越更大的模型。这项技术有望大幅降低企业应用中推理的成本。
    至顶网  VentureBeat  2025-03-14 14:45:02  
  • 让大语言模型学会何时"少思考":新加坡国立大学研究团队开发出自适应推理框架

    这项新加坡国立大学的研究开发了"Thinkless"框架,解决了大语言模型在推理时的效率问题。研究者通过引入两种控制标记和创新的解耦式相对策略优化算法,使模型能够智能地决定何时使用详细推理、何时直接给出简洁答案,就像人类面对不同难度问题时会灵活调整思考深度一样。实验结果表明,这种方法能减少50%-90%的详细推理使用,显著提高效率同时保持准确度,为构建更智能、更高效的AI系统铺平了道路。
    至顶网  科技行者  2025-05-22 08:28:45  
  • 一种完全不同的量子计算机类型

    对量子计算的另类探索,则始于一个名为IonQ的研究项目。
    至顶网  科技行者  2019-05-19 23:16:00  
  • 2021年,神经科学AI有这几大趋势

    4位专家对2021年神经科学人工智能的发展作出预测。
    至顶网  科技行者  2020-12-31 16:46:56  
  • IBM混合云行业生态:共筑高度受监管行业“乌托邦式的未来”

    IBM 认为,开放式混合云架构是一个集混合云的敏捷性和企业级AI的智能为一体的技术架构;与此相反,本文里提到的“像是科学怪人用碎片和部件堆砌起来的庞然怪物”是一个复杂难管、漏洞百出的架构,是一个“反乌托邦式”的架构。
    至顶网  IBM  2020-12-03 19:32:55  
  • Ampere Computing发布全新AmpereOne系列处理器,192个自研核

    Ampere Computing宣布推出全新 AmpereOne系列处理器,该处理器拥有多达192个单线程Ampere核,内核数量为业界最高。
    至顶网  Ampere  2023-05-19 15:45:00  
  • GPU比CPU耗电?NVIDIA用自身行动回应疑问

    其实,对于AI工作负载,NVIDIA GPU的能效是传统CPU服务器的42倍。NVIDIA的HGX-A100云服务器平台将16个NVIDIA V100 Tensor Core GPU连接在一起,可作为单一巨型GPU运行,提供2petaflops的AI性能,创下了单台服务器AI训练算力的纪录。
    至顶网  李祥敬  2021-11-12 11:16:19  
  • Group Think:多个并行推理智能体如何在标记级别协同合作

    这篇研究论文介绍了一种名为"Group Think"的创新方法,让单个大型语言模型能够同时扮演多个并行推理智能体,这些"思考者"能在标记级别相互协作。传统多智能体系统通常采用轮流推理方式,而Group Think实现了实时并行协作,智能体可以看到彼此的部分生成内容并动态调整。实验表明,这种方法不仅提高了推理质量,还显著降低了延迟,特别适合资源有限的边缘设备。研究团队提出了两种高效实现方案,并通过三类代表性问题验证了Group Think的优势。
    至顶网  科技行者  2025-05-21 14:20:30  
  • IBM打造InstructLab:为AI模型的创建与性能提升开启新时代

    IBM与红帽最近发布了InstructLab,这是一种用于大规模语言及代码模型的全新AI训练方案。
    至顶网  至顶网软件与服务频道  2024-06-18 14:47:50  
  • 启动前先热身:如何在资源受限环境下激发AI大模型的通用推理能力

    纽约大学阿布扎比分校研究团队提出了一种创新的两阶段训练方法,解决了AI领域的数据稀缺问题。他们首先让AI模型在简单的"骑士与恶棍"逻辑游戏中"热身",学习通用推理技能,然后再用少量特定领域数据进行强化学习。实验表明,这种方法不仅大幅提升了模型在数学、编程和多学科理解任务上的表现,还显著提高了样本效率,使用仅100个样本就能达到传统方法需要数千样本才能实现的效果。更重要的是,"热身"过的模型在适应特定领域后仍能保持跨领域的泛化能力,为资源受限环境下开发强大AI系统提供了实用策略。
    至顶网  科技行者  2025-05-26 17:01:41  
  • Google 新型机器人 AI 能够折叠精致的折纸,并能安全关闭拉链袋

    谷歌DeepMind在周三宣布了两个新AI模型,旨在控制机器人:Gemini Robotics和Gemini Robotics-ER。该公司声称,这些模型将帮助各种形状和大小的机器人更有效、更精细地理解和与物理世界互动,为人形机器人助手等应用铺平道路。
    至顶网  Arstechnica  2025-03-13 09:48:07  
  • OpenAI 新推理 AI 模型幻觉问题更严重

    OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色,但幻觉率却远高于以往模型,引发了对准确性的严重担忧,亟待进一步研究。
    至顶网  Techcrunch  2025-04-21 17:11:40  
  • 模型合并:一项提升大型语言模型预训练效果的强大武器——字节跳动Seed团队最新研究成果解析

    这篇研究探讨了模型合并技术在大型语言模型预训练中的应用。字节跳动Seed团队通过从百万到千亿参数级别的系统实验证明,在稳定训练阶段合并检查点不仅显著提升模型性能,还能准确预测学习率衰减效果,大大节省计算资源。研究提出的PMA策略使恒定学习率训练后通过简单合并就能获得相当于完成衰减训练的效果。此外,他们还发现该技术能有效提高训练稳定性,避免训练崩溃。通过全面实验分析,研究为开源社区提供了实用的预训练模型合并指南。
    至顶网  科技行者  2025-05-23 15:20:59  
  • GPT-4o在图像修复领域的初探:技术突破与现实应用的平衡之道

    想象一下,如果我们把传统的人工智能模型比作专业运动员,那么像GPT-4o这样的多模态大型语言模型就相当于全能型运动员。传统的AI模型可能只擅长一种特定技能(比如短跑或游泳),而GPT-4o则可以同时理解文字和图像,并且能够生成两种形式的输出。OpenAI在2025年推出的这个模型,将自回归架构(简单理解为一次预测一个元素,并利用之前的预测来指导后续预测)与多模态输入输出能力融合在一起,在图像生成方面展现出了前所未有的表现。
    至顶网  科技行者  2025-05-13 15:45:41  
  • 沃尔玛第三季度表现强劲:科技和数据大放异彩

    时下通货膨胀、供应链动荡、又正值假日季节、消费者对库存和价格都有担忧,但这些却可能意味着沃尔玛在第四季度的表现仍然强劲。究其原因,技术和数据是一个重要因素。
    至顶网  至顶网CIO与CTO频道  2021-11-18 14:34:23  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号