用了 0.129228秒,为您找到bob 什么 意思 網纸 YB233相关内容9785 条
  • ARM服务器之战即将爆发:AWS正面对阵微软

    亚马逊云科技过去几年来一直努力推动其Graviton产品线,AWS各大区域与数据中心正在全面迎接ARM新势力的到来。如今,微软也开始在Azure云上发布新实例,显然也想在ARM服务器芯片领域一展身手。
    至顶网  至顶网软件与服务频道  2022-04-08 10:47:46  
  • 代码效率优化的新突破:强化学习如何帮助大语言模型实现自我进化

    《Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization》这篇论文提出了一种创新的代码效率优化框架,通过强化学习技术让大语言模型能够自我改进生成代码的计算效率。研究表明,基于强化学习的方法(GRPO)能够持续优化代码性能,而传统的监督学习方法(SFT和DPO)则很快达到效率提升瓶颈。这一发现为解决大语言模型生成代码效率低下的普遍问题提供了有效途径,同时揭示了强化学习在教导AI自我完善方面的强大潜力。
    至顶网  科技行者  2025-06-04 09:14:25  
  • AI也会"看图说话"了!上海交大团队让机器视觉推理能力提升12%

    这项由上海交通大学与OPPO人工智能中心合作的研究首次深入探索了多模态大语言模型的视频空间推理能力提升方法。研究发现传统提示词对小型模型无效,转而采用GRPO强化学习训练法,构建了包含10万样本的VSI-100k数据集。最终,仅20亿参数的vsGRPO-2B模型性能提升12.1%并超越GPT-4o,证明了正确训练方法能够显著释放AI模型的空间理解潜力。
    至顶网  科技行者  2025-07-16 09:16:46  
  • 游戏制作人老于的自我修养:没爆款,也不影响内卷

    台上一分钟,台下十年功。在镜头拍不到的地方下功夫,是演员的自我修养,在玩家看不到的地方下功夫,是游戏制作人的专业素质。人可执棋,却也为子,这就是老于的写意人生。
    至顶网  至顶网码客人生频道  0000-00-00 00:00:00  
  • AWS助力客户通过数字孪生,提升业务价值

    从业者希望通过数字孪生改善运营态势、增强产品供应、交付更佳的业务价值,AWS开发出一套框架,帮助他们理解自身用例并实现商业价值。
    至顶网  至顶网CIO与CTO频道  2022-03-11 11:01:30  
  • 微软HoloLens 2现身:科技魔法走进真实世界

    HoloLens正在为人类提供一种新的工作、学习、交流和做事的方式。
    至顶网  CNET 记者 SCOTT STEIN  2019-02-26 10:28:24  
  • 谁才是真正的好老师?北科研团队比较不同推理蒸馏源对大语言模型影响

    这篇研究探讨了大语言模型知识蒸馏过程中教师模型选择的重要性。北科a-m-team团队从三个顶级模型(AM-Thinking-v1、Qwen3-235B-A22B和DeepSeek-R1)收集了189万个问题的推理答案,分析发现AM-Thinking-v1生成的数据表现出更多样的令牌长度分布和更低的困惑度。使用这些数据训练的学生模型在AIME2024(84.3分)、AIME2025(72.2分)、MATH500(98.4分)和LiveCodeBench(65.9分)等基准测试中,AM蒸馏模型始终表现最佳,并展现出根据任务难度动态调整输出长度的能力。
    至顶网  科技行者  2025-05-26 08:10:53  
  • 人工智能也能看懂手语了?MIT团队让机器秒懂聋人对话的神奇技术

    MIT研究团队开发出革命性的手语视频搜索技术,能够通过普通文字搜索找到对应的手语视频内容。该系统运用深度学习建立手语与文字间的语义映射,准确率达到87%,为全球7000万聋人群体打开数字世界大门。技术有望在教育、社交媒体、客服等领域广泛应用,推动建设更包容的数字社会。
    至顶网  科技行者  2025-08-21 10:01:10  
  • 并联扩展:在不增加参数的情况下提升大模型能力的全新方法 - 阿里巴巴钱文团队揭示并联计算缩放定律

    由阿里巴巴钱文团队与浙江大学合作的研究提出了"并联缩放"(ParScale)方法,一种全新的大语言模型能力提升策略。不同于增加参数或延长推理时间的传统方法,ParScale通过多路并行计算来提升模型性能:它使模型同时从多个角度处理同一输入,再智能整合结果。研究表明,P倍并行计算相当于增加O(log P)倍参数,但内存和延迟开销显著降低。对于1.6B参数模型,8路并行可节省22倍内存增长和6倍延迟增长。更重要的是,此方法可应用于现有模型,通过少量数据的后训练即可实现性能提升,为资源受限场景下部署强大AI提供新思路。
    至顶网  科技行者  2025-05-20 18:07:10  
  • 金融券商走进华为,这场CXO与华为云的交流,带来哪些“智慧碰撞”?精彩回放来了

    7月16日,华为云与财联社联合举办“走进华为·金融证券CXO创新私享会”
    至顶网  至顶网数字化转型频道  2022-07-19 11:20:17  
  • 记忆坚实的世界:斯坦福和上海交大研究团队为视频世界模型打造长期空间记忆

    斯坦福大学和上海交大等机构的研究团队提出了一种为视频世界模型增加长期记忆能力的创新方法。受人类记忆机制启发,他们设计了三种互补的记忆系统:短期工作记忆、基于点云的长期空间记忆和稀疏情节记忆。这种组合允许AI在生成长视频时保持场景的空间一致性,解决了现有模型因有限上下文窗口导致的"遗忘"问题。实验表明,该方法在视角回忆一致性和整体视频质量方面显著优于现有技术,为创建持续一致的虚拟世界铺平了道路。
    至顶网  科技行者  2025-06-09 16:59:05  
  • 韩向东:实现企业数字化转型的“四大路径业”

    在深刻理解了企业数字化之后,我们要面对的下一个问题就是如何推进数字化进程,以顺利实现数字化转型。数字化转型牵扯甚广,既无法一蹴而就,也很难一帆风顺,需要整体规划、分步实施、有序推进。下面,我们将给出数字化转型的四条路径。
    至顶网  业界供稿  2021-10-19 11:32:08  
  • 揭秘"隐形推理令牌":马里兰大学研究团队开发CoIn系统,为大模型API计费提供透明保障

    CoIn是马里兰大学研究团队开发的创新框架,旨在解决大型语言模型商业API不透明计费问题。这些API隐藏推理过程只显示最终答案,却仍对所有"看不见"的令牌收费。CoIn通过令牌数量验证和语义有效性验证两大组件,使用户能够审计隐藏令牌而不暴露专有内容。实验表明,即使面对复杂攻击,CoIn的检测成功率高达94.7%,为商业AI服务提供了前所未有的计费透明度。
    至顶网  科技行者  2025-05-27 10:11:23  
  • 用程序分析反馈训练大型语言模型生成高质量代码:加州大学圣地亚哥分校和微软的突破性研究

    这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
    至顶网  科技行者  2025-06-07 09:55:05  
  • 华为云张鹏:专属月为“互联网”打造了一个“新价值连接器”

    10月15日,华为云举办了“华为云专属月·行业深耕”发布会,开启了2021年的专属月行动。其中包括1.3亿元上云津贴,为互联网企业,特别是电商、游戏、移动出行行业提供多类型、多组合、高频场景的专属商务政策等云产品及服务,成为互联网企业连接未来的桥梁。
    至顶网  业界供稿  2021-11-16 17:00:42  
  • InternVL3.5:上海AI实验室的多模态AI新突破,让机器像人一样理解图文世界

    上海AI实验室发布的InternVL3.5是新一代开源多模态大语言模型,能够同时理解图像和文字内容。该系统采用级联强化学习技术,推理性能提升16%,并通过视觉分辨率路由器实现4倍推理加速。在36项基准测试中表现优异,最大模型在多学科推理任务中得分77.7,接近商业模型水平,支持GUI交互、多语言处理等功能。
    至顶网  科技行者  2025-09-01 15:53:20  
  • 元宇宙与码世界,谁是数字社会的最高生态

    2021年入冬前夕,两本关于数字世界的专著前后出版。
    至顶网  业界供稿  2021-11-12 11:45:34  
  • 飞腾总经理窦强:20年CPU之路,做新时代的攀登者

    CPU只有方寸大小,却足以撼动世界。在国内CPU研发之路上,飞腾公司有着浓墨重彩的一笔。今天,也是飞腾CPU首届生态合作伙伴大会召开的日子。
    至顶网  黄当当  2019-12-19 17:20:02  
  • 新加坡国立大学团队揭秘:如何让AI写代码时既安全又好用?

    新加坡国立大学等机构联合开发的SecCoderX框架成功解决了AI代码生成中安全与功能相冲突的难题。该框架通过创新的漏洞诱导任务合成、基于推理的奖励模型和在线强化学习,实现了代码安全性和功能性的同步提升。实验显示,SecCoderX将有效安全率提升约10%,而传统方法往往导致性能下降。研究团队已开源相关技术,为AI辅助软件开发的安全性提供了可靠解决方案。
    至顶网  科技行者  2026-02-12 13:28:32  
  • 加速扩散大语言模型:UCLA研究团队提出自适应并行解码新方法

    UCLA计算机科学系研究团队提出的"自适应并行解码"(APD)方法,成功解决了扩散大语言模型面临的速度与质量权衡难题。该方法通过动态调整并行生成的词数,结合一个小型辅助自回归模型来评估生成质量,并引入KV缓存和掩码输入限制等优化措施,使扩散模型能在保持高质量输出的同时显著提升生成速度。实验表明,使用APD的Dream 7B模型不仅能达到每秒59个词的吞吐量(比基线提升近6倍),还在数学推理等任务上保持了接近原始水平的准确率,甚至超越了传统自回归模型的速度。
    至顶网  科技行者  2025-06-06 17:25:16  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号