搜一下
用了 0.288877秒,为您找到
信誉
最好
靠谱
大发
平台
罔芷
88pkee
驻测
相关内容28382 条
北大团队革命性突破:让小模型当"领路人",大语言模型秒变道德楷模
北京大学研究团队提出"弱到强解码"创新框架,让小型礼貌模型为大语言模型提供良好开头,解决AI道德对齐难题。该方法在保持专业能力的同时显著提升安全性,避免传统微调的性能损失,为低资源环境下的AI对齐提供了经济高效的解决方案,展现了巧妙协作胜过单纯扩大模型规模的设计智慧。
至顶网
科技行者 2025-06-12 11:23:15
微软推出Windows 11 AI PC:全新Surface Pro和Surface Laptop
今日,微软和Surface推出了有史以来更快、更智能的Windows PC品类:Windows 11 AI PC。全新的Surface Pro和Surface Laptop是全新的Windows 11 AI PC,提供了惊人的性能、长效电池续航和全新的AI体验,展示了软硬件结合的优美和创新。
至顶网
业界供稿 2024-05-22 08:54:06
UMoE:让AI更聪明的"专家分工制"——东京科学技术大学等联合推出统一混合专家架构
这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构,通过重新设计注意力机制,实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法,同时保持了较低的计算开销,为大语言模型的高效扩展提供了新思路。
至顶网
科技行者 2025-07-08 13:52:30
黄仁勋与扎克伯格做了一场关于Meta生成式AI未来的探讨(附对话实录)
英伟达CEO黄仁勋和Meta CEO马克·扎克伯格,在美国丹佛举行的第50届SIGGRAPH图形大会上进行了一场关于生成式AI的对话,并且他们还互赠了皮衣。
至顶网
王聪彬 2024-07-30 16:38:56
Tencent最新发布:一键生成代码评测"神器",让AI编程测试不再依赖人工标注
腾讯混元团队开发了AutoCodeGen自动化系统,能够无需人工干预生成高质量编程测试题目。基于此创建的AutoCodeBench包含3920道题目,覆盖20种编程语言,是首个大规模多语言自动生成的代码评测
平台
。对30多个主流AI模型的测试显示,即使最先进的模型通过率也仅有52.4%,揭示了当前AI编程能力的局限性,特别是在小众语言和复杂多逻辑编程方面仍有很大提升空间。
至顶网
科技行者 2025-08-15 08:24:22
大模型训练的"调味料"革命:这种简单方法让AI学习速度提升10倍
深圳大学、腾讯等机构联合提出ReDit方法,通过在离散奖励信号中添加随机噪音解决AI训练中的梯度不稳定问题。该方法将学习速度提升约10倍,在数学推理等任务上显著改善模型性能,为大语言模型训练提供了简洁高效的优化方案。
至顶网
科技行者 2025-06-26 12:50:57
HPE渠道和生态负责人:我们将给所有合作伙伴带来AI机会
HPE全球渠道和生态系统负责人Simon Ewington表示,HPE拥有“广泛”的AI渠道战略,将为所有HPE合作伙伴带来机会。
至顶网
至顶网计算频道 2024-05-16 09:52:48
对话五家人形机器人团队:2023因何成了人形机器人盛世?
2023年,人形机器人迎来了高光时刻。
至顶网
金旺 2023-08-17 19:47:04
对话五家人形机器人团队:2023因何成了人形机器人盛世?
2023年人形机器人的产业巨变和背后推动力。
至顶网
金旺 2023-08-17 19:43:12
Atla公司发布Selene Mini:一个8B参数的强大语言模型评估器,性能超越GPT-4o-mini
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。
至顶网
科技行者 2025-09-15 14:44:11
2023看得见的未来:数据中心行业十
大发
展趋势
施耐德电气每年年初都会基于深刻的行业洞察和实践发布《看得见的未来—数据中心市场的新趋势与新突破》以揭示新一年数据中心行业会发生哪些变化,有哪些趋势会影响数据中心行业未来的发展方向以及这些变化和趋势对数据中心运营商的价值和意义。
至顶网
业界供稿 2023-02-07 15:13:24
深潜大语言模型的"真空地带":不是所有层都在全力工作,偷懒的层竟然越过越好?
这项研究揭示了大语言模型中存在"空域"——在推理过程中几乎不活跃的神经网络层。研究者开发了L2自适应计算方法,无需额外训练即可准确识别这些空域。惊人的是,在Qwen2.5-7B模型上,跳过70%的层后性能反而从69.24%提升到71.29%;Mistral-7B在GPQA测试中跳过约30%的层后,准确率提高了4.48%。这表明不同模型层的贡献极不均衡,有选择地跳过"懒惰层"不仅能保持性能,有时甚至能提升结果,为未来模型优化提供了新思路。
至顶网
科技行者 2025-05-27 10:14:04
5G路上,绕不开的毫米波
5G要发展,频谱需先行。
至顶网
周雅 2019-03-20 22:26:35
解读亚马逊re:Invent首日,AWS CEO五十多次提及重塑 加速企业上云及数字创新
今年的re:Invent上,Andy Jassy再次为全球40多万名注册观众带来长达三小时的主题演讲,并且一口气发布27项创新的云服务和功能(当天总共发布43项新服务和功能),令到场的媒体和分析师惊叹。
至顶网
至顶网CIO与CTO频道 2020-12-07 10:02:47
马里兰大学推出DynaGuard:让AI守门员学会理解你的专属规则
马里兰大学研究团队推出DynaGuard,这是首个能理解用户自定义规则的AI守护模型。不同于只能识别预设类别的传统系统,DynaGuard能处理自然语言编写的任何规则,并提供详细解释帮助AI自我纠正。该模型基于40000个场景的DynaBench数据集训练,在传统安全任务和定制规则处理上都表现优异,为AI安全技术开辟了新方向。
至顶网
科技行者 2025-09-22 10:28:15
对话比特币基金会创始主席:穿越市场熊市,区块链在中国前景更广阔
上周,Peter Vessenes到访中国,接受了科技行者的专访,谈了谈关于区块链、加密货币、STO等领域的各类热点话题。
至顶网
周雅 2018-11-13 15:27:18
CIO指南:采用开源生成式AI需要注意的十件事
企业应该知道该怎么做才能确保他们使用的是经过适当许可的代码,如何检查漏洞,如何保持所有内容都已经修补并保持最新状态。
至顶网
至顶网CIO与CTO频道 2024-05-28 10:59:20
领英如何认识并运用人工智能
2005年,我在AT&T(美国电报电话公司)贝尔实验室开始了我的职业生涯。当时,电信产业正受困于价格战和来自无线运营商的竞争,看着一个又一个同事离职,前往谷歌和雅虎这样正蓬勃发展的消费互联网产业寻求职业发展机会时,我不禁也开始思考自己的下一步。
至顶网
领英人工智能负责人Deepak Agarwal 2018-11-07 11:10:03
大型语言模型的"深度诅咒":牛津大学发现训练深层网络的致命缺陷及解决方案
牛津大学研究团队发现大型语言模型存在"深度诅咒"现象:深层网络对模型贡献微乎其微,造成计算资源浪费。研究揭示Pre-LN架构中方差指数增长是根本原因,并提出层归一化缩放(LNS)解决方案。LNS通过简单的缩放因子控制方差增长,让每层都发挥作用,在各种规模模型上都实现显著性能提升,为提高AI训练效率提供了重要突破。
至顶网
科技行者 2025-08-21 16:37:32
能识别驾驶员状态行为的监控系统,其实还不够精准可靠
目前汽车行业发现了一项可怕的事实:驾驶员使用部分自动化功能的时间越长,其对于驾驶本身就变得越是漫不经心。
至顶网
科技行者 2020-12-22 15:17:56
<
上一页
166
167
168
169
170
171
172
173
174
175
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号