搜索大发玩大小单双的有人带么【罔芷:——88pk·ee—

R2R：使用小型-大型模型令牌路由高效导航分歧推理路径

最近来自清华大学、无限极AI和上海交通大学的研究团队提出了一种名为"通向罗马之路"(R2R)的创新方法，可以在小型和大型语言模型之间进行智能令牌路由。研究发现，小型模型与大型模型的推理路径差异主要源于少量"分歧令牌"。R2R方法只在这些关键令牌上使用大模型，其余时间使用小模型，既保证了推理质量，又提高了效率。实验表明，使用平均5.6B参数的R2R方法超越了14B参数模型的性能，同时提供了2.8倍的速度提升。

至顶网科技行者 2025-06-01 18:58:56

Google Cloud CEO辞职前甲骨文CEO将于明年初上任

Google Cloud首席执行官Diane Greene即将离职，自她加入Google Cloud以来，该部门一直是Google的一个战略重点。

至顶网 siliconANGLE 2018-11-19 14:28:49

Mamba再下一城！上海AI Lab提出视频领域新SOTA VideoMamba！

数源AI推荐的论文‘VideoMamba: State Space Model for Efficient Video Understanding‘介绍了VideoMamba模型，它通过线性复杂度运算符实现高效长视频理解。该模型克服了3D CNN和视频变换器的局限，具备可扩展性、敏感性、优越性和兼容性。

至顶网数源AI 2024-03-13 19:04:22

Veritas：企业应该尽早行动，来构建面向多云的数据保护

云和虚拟化技术的加速采用为中国企业带来了更多的IT复杂性，并由此产生了数据安全等挑战。

至顶网任新勃 2021-10-12 09:23:38

Cisco 发布 AI Defense：应对大规模 AI 安全挑战

随着人工智能在各行业的快速普及，企业面临着AI应用的安全风险。为此，思科推出了AI Defense安全解决方案，旨在通过整合企业网络和云环境中的可视性、验证和执行功能，帮助组织保护AI部署。该方案体现了企业对AI安全的重视，以及业界在AI治理和监管方面的发展趋势。

至顶网 Forbes 2025-02-07 11:17:20

微软首席技术官韦青：从理论到实践的智慧城市建设

第九届中国（天津滨海）国际生态城市论坛暨2018中国国际数字经济创新峰会于9月7日-8日在天津举行。微软（中国）首席技术官韦青出席大会，并做了题为《智慧城市建设——从理论到实践》的演讲。

至顶网科技行者 2018-09-07 14:51:16

第十届全国管理案例精英赛中国政法大学校园突围赛成功举办

2024年5月11日晚，第十届全国管理案例精英赛中国政法大学校园突围赛在学院路校区图书综合楼0320教室成功举办。大赛旨在通过对实际案例的分析和解决，锻炼参赛选手的团队合作能力、创新思维和解决问题的能力。

至顶网业界供稿 2024-05-24 11:09:51

极智AI | 解读大模型量化算法之GPTQ

GPTQ 的核心思想是通过最小化量化引入的输出误差，实现高精度低比特量化。具体来说，GPTQ 在后量化过程中，针对每一层的权重矩阵，利用一小部分校准数据，最小化量化前后模型输出的差异。

至顶网极智视界 2024-10-10 17:04:28

北大团队揭秘AI安全训练为何如此脆弱——大模型中隐藏的"弹簧效应"

这项由北京大学人工智能研究院完成的研究,首次从数据压缩理论角度揭示了大型语言模型存在"弹性"现象——即使经过精心安全对齐,模型仍倾向于保持预训练时的行为分布。

至顶网至顶AI实验室 2025-10-11 17:32:40

360周鸿祎：未来可能坐着智能汽车、吃着火锅唱着歌，就被黑客劫持了

“大家看过电影《速度与激情8》吧，电影里满大街自动驾驶的僵尸车追逐俄罗斯国防部长的车。如果以后满大街都是这种智能汽车，这个电影桥段一定会成为现实”，360集团董事长兼CEO周鸿祎在5月16日，第二届世界智能大会上表示。

至顶网业界供稿 2018-05-17 11:11:56

当教育遇上AI，能否解开焦虑与内卷的死结？

当今世界改变的速度已与过去不同，每当文明经历一个颠覆性的技术革命，都给这个世界带来了深刻的变化。 ——《世界是平的》

至顶网于佳卉 2025-01-20 12:02:50

当教育遇上AI，能否解开焦虑与内卷的死结？

当今世界改变的速度已与过去不同，每当文明经历一个颠覆性的技术革命，都给这个世界带来了深刻的变化。 ——《世界是平的》

至顶网于佳卉 2025-01-20 14:30:28

英伟达DGX Spark：小巧超算处理大模型的新选择

英伟达推出售价3000-4000美元的DGX Spark，号称"全球最小AI超算"。该设备搭载128GB内存，基于Blackwell架构的GB10芯片，虽然速度不及RTX 5090，但能运行消费级显卡无法处理的大模型。支持2000亿参数模型推理和700亿参数模型微调，在AI开发领域具有独特优势，但软件生态仍需完善。

至顶网 The Register 2025-10-15 10:54:57

数字世界“网事”，一颗芯如何做到润物细无声？

互联网如何走过了从“高分贝的猫语”到“丝滑无声上网”？

至顶网周雅 2023-11-16 21:27:02

云托管服务供应商必不可少的四大理由

对大多数人来说，“云”一词与亚马逊网络服务、微软Azure和谷歌同义。这也能被理解，因为它们是目前为止最受认可和最成功的超大规模的公共云提供商。然而，这三位行业领导者并非注定会完全占据市场。

至顶网 Danny Allan, Veeam产品策略副总裁 2019-08-13 11:49:09

AI正吞噬互联网，但人类内容有望逆风翻盘

AI技术正在全面渗透互联网各个角落，从虚假文章到社交媒体内容，威胁着人类原创内容的生存空间。尽管出现了AI演员、AI音乐和AI搜索答案等应用，但消费者对纯AI生成内容仍持谨慎态度。调查显示，仅12%的人接受完全由AI生成的新闻，而62%的人更偏好人类制作的内容。出版业高管对此保持乐观，认为人们仍然偏爱来自真人的内容。与此同时，出版商正通过版权诉讼和技术手段积极应对AI公司的内容抓取行为。

至顶网 cnet 2025-10-13 10:08:29

SK Telecom发布自主研发的韩语大语言模型

韩国SK电信发布了A.X 3.1 Lite，这是一个70亿参数的韩语大语言模型，完全从零开始自主开发。该模型在1.65万亿多语言标记上训练，重点关注韩语内容，可在智能手机上运行且无需云端支持。模型在韩语多任务推理基准测试中表现优异，响应时使用的标记数比同类GPT模型少三分之一。已开源并应用于SK电信的A.dot语音助手，支持实时通话摘要等功能。

至顶网 Forbes 2025-07-17 07:51:50

动态分层剪枝：让大型语言模型"减肥"更聪明

这项研究提出了动态分层剪枝（DLP）方法，通过自动确定大型语言模型中各层的相对重要性来分配不同的剪枝率。与传统均匀剪枝方法相比，DLP在高稀疏度条件下表现优异，在70%稀疏度时可将LLaMA2-7B的困惑度降低7.79并提高平均准确率2.7%。DLP与多种模型压缩技术兼容，在CPU上可实现2.8x-3.7x的推理加速，为资源受限设备上部署大型语言模型提供了新方案。

至顶网科技行者 2025-06-07 16:01:23

重新思考大型语言模型推理的采样标准：基于能力-难度对齐的视角

本研究提出了"能力-难度对齐采样"方法（CDAS），革新了大型语言模型强化学习训练中的数据采样策略。与传统方法不同，CDAS通过聚合历史表现差异实现更稳定的问题难度估计，并将模型能力与问题难度动态匹配。在多个数学推理基准测试中，CDAS达到了46.77%的最高平均准确率，同时比竞争策略提高了2.33倍的计算效率。研究还证明了CDAS在代码生成任务和更大型模型上的有效性，为提升大型语言模型的推理能力提供了高效可靠的新方法。

至顶网科技行者 2025-05-29 14:50:15

新华三首发Wi-Fi 7是否再次引发传统网络架构新变革？

4月7日，紫光股份旗下新华三集团全球首发企业级智原生Wi-Fi 7 AP新品WA7638和WA7338。为什么说可以引发传统网络架构新变革？我们先来了解一下新华三的Wi-Fi 7 AP是一款什么样的产品。

至顶网董培欣 2022-04-13 13:56:04