搜一下
用了 0.146841秒,为您找到
bob
这个
平台
怎么样
網纸
YB233
相关内容13595 条
Kinetics:从全新视角重新思考大语言模型测试阶段的资源分配,卡内基梅隆大学研究表明稀疏注意力机制至关重要
卡内基梅隆大学研究团队提出全新"Kinetics"缩放定律,揭示大语言模型测试阶段的资源分配策略需要重新思考。研究发现小型模型效率被严重高估,因为以往研究忽略了内存访问成本这一关键瓶颈。在测试阶段,注意力机制而非参数数量成为主要成本因素。基于此,团队提出以稀疏注意力为核心的新范式,显著提升问题解决准确率,在AIME测试中低成本场景下提升高达60个百分点,高成本场景下仍有5个百分点优势。
至顶网
科技行者 2025-06-10 13:52:20
2025年必须避免的5个云计算错误
云计算已成为全球商业的基础,但许多企业在使用云时仍存在误区。本文总结了5个常见错误:未从战略角度看待云、忽视安全、未将云与AI战略结合、未控制AI成本、被供应商锁定。避免这些错误对充分发挥云的创新潜力至关重要。企业应将云视为战略能力,注重安全文化建设,融合云与AI,控制成本,保持灵活性,以驱动增长和创新。
至顶网
Forbes 2025-04-04 10:59:44
FuxiMT:基于稀疏化大语言模型的中文为中心多语种机器翻译系统——天津大学和清华大学联合打造跨语言沟通新桥梁
天津大学和清华大学研究团队开发的FuxiMT是首个中文为中心的多语言翻译模型,基于BLOOMz模型并整合了混合专家技术,支持65种语言的翻译。其采用两阶段训练策略:先在50亿中文句子上预训练,再通过课程学习方法在多语言并行语料上微调。实验表明,FuxiMT在各种资源水平的语言对翻译任务中均优于主流基线,尤其在低资源语言和零样本翻译中表现突出,为跨语言交流提供了新解决方案。
至顶网
科技行者 2025-05-29 12:02:35
IPF2020浪潮首提智算中心 布局智慧时代“算力工厂”
如果熟悉IPF的朋友应该知道,每届的IPF浪潮都会展示其对产业的全新思考,本届大会则提出了智算中心,令人耳目一新。
至顶网
李祥敬 2020-04-15 15:56:32
修复"伤害"模型表现的数据:级联LLM技术重标注负面样本,提升信息检索的稳健性
这项来自加拿大滑铁卢大学的研究挑战了"更多训练数据总是更好"的观念,发现某些数据集反而会损害信息检索模型性能。研究者提出了RLHN方法,使用级联LLM技术识别并重标注训练数据中的"假负样本"。实验表明,这种方法显著提升了检索和重排模型在BEIR和AIR-BENCH基准测试上的性能,尤其在处理未见过的领域时效果更佳。人类验证结果证实了该方法的可靠性,为构建更准确、鲁棒的信息检索系统提供了新思路。
至顶网
科技行者 2025-05-28 19:54:03
体验评测之——上班族与荣耀V20的一天
2018年底,V系列年度旗舰荣耀V20正式发布,作为2018年旗舰机的收官之作,这款新品也顺理成章地被很多人纳入新年礼物愿望清单之中。元旦过后,我们也拿到了这款机器,它到底值不值得购买呢?
至顶网
至顶网智能手机频道 2019-01-14 14:18:02
2023戴尔科技集团全球大会:围绕多云架构和“即服务”两大趋势打造新产品
近日召开的戴尔科技集团全球大会上,戴尔科技集团发布了Dell APEX、多云和边缘解决方案。
至顶网
任新勃 2023-05-25 15:18:10
EPOS 荣获 Frost & Sullivan 2021年全球竞争策略领导奖
2021年6月29日基于最近的全球专业耳机市场分析, 优质音频和视频解决方案公司EPOS(音珀)荣获Frost & Sullivan 2021年全球竞争策略领导奖(2021 Global Competitive Strategy Leadership Award)。
至顶网
至顶网网络与安全频道 2021-06-29 17:51:39
紫光云2.0
平台
开放公测: 新能力,新体验
3月30日,紫光云宣布新一代云
平台
紫光云2.0版本——“紫鸾”
平台
正式开放注册。紫鸾
平台
定位于面向新基建的公有云,依托紫光云全新2.0架构,覆盖计算、存储、网络、安全、数据库和人工智能6大产品服务,为用户带来“新快智简”的卓越上云体验。
至顶网
邹大斌 2020-04-07 16:28:39
超越数字反馈:Critique-GRPO如何帮助大语言模型通过自然语言批评提升推理能力
这项研究提出了Critique-GRPO,一种创新的在线强化学习框架,将自然语言批评与数字反馈相结合,克服了传统仅用数字反馈的三大局限:性能瓶颈、自我反思效果有限和顽固性失败。实验表明,该方法使大语言模型能够从错误中学习并改进,在八项数学和通用推理任务中,将Qwen2.5-7B和Qwen3-8B模型的平均通过率分别提高了约4.5%和5%,超越了包括那些引入专家示范的方法。研究还揭示,高熵探索和长回答并不总是最有效的学习方式,质量更重要。这一方法为大语言模型的自我提升能力开辟了新路径。
至顶网
科技行者 2025-06-07 17:00:24
科技赋能物企转型升级,千丁云1.0今日正式上线
当下,“智慧社区”概念时风日盛,传统物业管理企业转型升级成为行业发展大势所趋,特别是业主对物业服务需求的不断提升,传统的物业服务管理显然无法适应新形势下的发展。如何破局,成为了物业管理行业发展面临的关键。
至顶网
业界供稿 2018-11-16 16:52:13
SAP发布第一季度财报 云业务保持稳健增长
SAP今天发布了第一季度财报,结果低于分析师的预期,但收入增长强于预期。该季度SAP每股收益为1.08美元,低于市场普遍预期的1.22美元,收入同比增长11.5%,达到76.3亿美元,超过华尔街预期的74.1亿美元。
至顶网
至顶网软件与服务频道 2022-04-26 10:59:50
双域稳健性:CLIP模型需要一个稳健的文本编码器
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
至顶网
科技行者 2025-06-08 16:44:33
干货|行业专家谈多云时代媒体融合发展之道
作为全球领先的端到端企业级IT基础架构和云计算提供商,戴尔科技集团通过领先的云计算解决方案,以及广泛的合作,推进媒体深度融合发展。
至顶网
戴尔 2020-12-11 17:12:41
VMware结盟三星、AMD和RISC-V合作推进机密计算
VMware将与新的合作伙伴一起致力于推动一项名为“Certifier Framework for Confidential Computing”的开源项目,该项目旨在克服采用机密计算的一些最大障碍。
至顶网
至顶网计算频道 2023-06-30 09:55:51
首届华为智慧园区合作伙伴大会成功召开,打造园区智能体
1月11日-12日,以“打造园区智能体,共建全场景智慧”为主题的“华为智慧园区合作伙伴大会”在华为三丫坡成功举办。
至顶网
业界供稿 2021-01-22 12:09:55
西部数据宣布分拆为两家公司 分别生产硬盘和闪存
西部数据(Western Digital)宣布计划分拆为两家公司,分别生产硬盘驱动器和闪存,公司股价今日上涨近6%。
至顶网
至顶网存储频道 2023-10-31 09:18:59
亚马逊新推出的 Alexa+ 迫使品牌重新思考其营销策略
随着 Amazon 即将推出 Alexa+,品牌需要紧急调整其数字营销策略以适应语音购物时代。最新专利显示,Alexa 将与 Amazon 的 Rufus 产品智能系统深度整合,优先考虑那些拥有完整产品属性数据且使用日常会话语言的品牌。这一转变既带来挑战也创造机遇,传统的关键词优化将让位于更注重属性和对话的产品内容策略。
至顶网
Forbes 2025-03-17 16:45:38
网络基础设施制造商Extreme Networks季度业绩差过华尔街预期
美国网络基础设施制造商Extreme Networks发布业绩报告,营业额出现两位数的反弹,但公司股价在周三第四季度财报发布后后几乎跌了五成。这是在提醒大家,科技公司如业绩未能达到华尔街的预期就存在危险。
至顶网
The Register 2018-08-13 11:05:41
传闻证实:Nvidia将以69亿美元收购Mellanox
Nvidia今天宣布已经达成协议,将以69亿美元的价格收购数据中心网络专业厂商Mellanox Technologies,为最近关于Nvidia收购计划的传闻画上了句号。
至顶网
siliconangle 2019-03-12 10:52:31
<
上一页
305
306
307
308
309
310
311
312
313
314
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号