搜一下
用了 0.132712秒,为您找到
澳洲
幸运
10
怎么
網纸
YB233
相关内容14588 条
Moonshot AI发布Kimi-VL:仅用3B参数就能媲美大型AI的超级视觉模型
Moonshot AI发布了新一代视觉语言模型Kimi-VL,该模型采用混合专家架构,仅用2.8B激活参数就能媲美大型模型性能。其创新包括原生分辨率视觉编码器、128K长上下文处理能力和长链思考推理机制。在多项基准测试中,Kimi-VL在数学推理、文档理解、智能体任务等方面表现出色,证明了小参数高效能的设计理念,为AI技术的普及和可持续发展提供了新思路。
至顶网
科技行者 2025-07-17 09:28:25
腾讯YouTu实验室AI新突破:仅用一张正常图片就能识别所有类型的工业缺陷
腾讯YouTu实验室推出OneNIP技术,仅需一张正常图片就能检测多种工业产品缺陷。该技术通过双向交叉注意力机制和正常图像提示,解决了传统方法需要为每种产品单独训练模型的问题。在MVTec等权威数据集上,OneNIP在像素级异常分割任务中取得显著提升,为智能制造中的质量控制提供了新思路。
至顶网
科技行者 2025-07-10 09:35:06
从病毒研究谈起,聊聊冷冻电镜及背后的HPC
通常来讲,1-2岁的婴幼儿不能戴口罩。N95口罩透气度较差,不适合孩子使用。对于儿童,推荐佩戴儿童专用的防护口罩,且家长需随时注意孩子有无呼吸困难等不适情况。
至顶网
戴尔 2020-02-06 16:17:58
北京大学等顶尖高校联手破解AI记忆难题:让大模型学会"压缩记忆"的神奇技术
这项由北京大学等多家顶尖机构联合完成的研究解决了大语言模型的关键技术难题:如何高效管理AI的"记忆系统"。研究团队开发的KV-CoRE技术能够智能压缩AI记忆,在几乎不影响性能的前提下大幅节省存储空间和提升运行速度,为AI系统的实际部署提供了革命性解决方案。
至顶网
科技行者 2026-02-11 13:02:29
混搭拼图增强与置信度边界加权伪标签:如何让模型在无源数据的情况下更好地适应新环境
罗切斯特理工学院和美国陆军研究实验室的研究团队开发了一种突破性的无源域适应方法,通过混搭拼图增强技术和置信度-边界加权策略,使AI模型能在没有原始训练数据的情况下适应新环境。该方法在三个主要基准数据集上取得显著成果,特别是在PACS数据集上准确率提升了7.3%,为AI系统在隐私保护、安全限制等现实场景中的应用提供了新解决方案。
至顶网
科技行者 2025-06-06 11:27:13
盘点IBM 2018十大洞见
面对无法阻止的更迭,IBM并不认为随波逐流会有任何帮助,与IBM一起积极拥抱变化,早先一步做好准备,未知,也许会是最好的礼物。
至顶网
业界供稿 2018-12-25 16:26:33
从普及应用到高质量发展,腾讯分享微信电子健康卡开放平台实战经验
9月16日,由中国卫生信息与健康医疗大数据学会健康卡应用与管理专业委员会主办、腾讯健康协办的“全国电子健康卡(码)高质量发展交流会”系列会议召开。
至顶网
业界供稿 2022-09-20 17:28:13
阿里巴巴研究团队突破多角色面部动画技术:让照片中的多个人物同时"活"起来
阿里巴巴集团高德地图团队与北京邮电大学合作开发的FantasyPortrait系统,实现了突破性的多人肖像动画技术。该系统采用隐式表情控制和遮罩交叉注意力机制,能够让静态照片中的多个人物同时展现不同的表情动作,在跨身份重现和多人协调动画方面显著优于现有方法,为影视制作、虚拟通信和游戏娱乐等领域带来革命性突破。
至顶网
科技行者 2025-07-23 19:04:22
CPGD:让语言模型的规则强化学习更稳定可靠
这项研究提出了CPGD算法,解决语言模型规则强化学习中的训练不稳定问题。通过用策略梯度损失替代PPO-clip损失,并引入裁剪机制和策略漂移正则化,CPGD有效避免了现有方法中由重要性采样比率引起的训练崩溃。实验结果表明,CPGD在多个多模态数学基准测试上显著优于其他强化学习算法,与基础模型相比平均提升11.0%的性能,尤其在领域内测试上提升21.8%,展现出卓越的稳定性和泛化能力。
至顶网
科技行者 2025-05-22 08:26:13
GTC China 2018:NVIDIA宣布多方位AI产品布局
2018年11月21日,NVIDIA在苏州举办了GTC China大会。大会上,NVIDIA创始人兼首席执行官黄仁勋在两个多小时的主题演讲中为我们分享了NVIDIA对于AI时代的思考以及众多新产品、新技术和新服务。
至顶网
业界供稿 2018-11-26 11:07:16
StepFun发布Step-Audio 2:让AI像人类一样自然对话,首个真正懂"言外之意"的语音助手
StepFun团队发布了突破性语音AI系统Step-Audio 2,这是首个真正实现端到端语音对话的模型,能直接处理语音而无需文字转换。该系统不仅能理解语言内容,还能感知情绪、语调等副语言信息,并用自然的语音回应。通过8百万小时语音数据训练,在多项测试中超越GPT-4o等商业系统,代表了人机交互技术的重大进步。
至顶网
科技行者 2025-07-28 10:58:19
战“疫”新产业 发展新动能──天津把握危中之机培育新的经济增长点
2020年的天津,同样的时节,同样积蓄着新生的力量,迎接着生命力更为强壮的盛夏。
至顶网
至顶网云计算频道 2020-06-08 10:55:27
中科院联手美团推出MoTE:让大模型告别"内存吃货"时代的神奇瘦身术
中科院与美团联合推出MoTE技术,通过"三值专家混合"架构巧妙解决大模型内存消耗问题。该技术保留原模型的全精度共享专家,同时添加多个内存高效的三值路由专家,在3B参数规模下内存消耗减少60%以上,性能反而提升1.6%。这项突破为在普通设备上部署强大AI模型开辟了新路径。
至顶网
科技行者 2025-06-24 13:50:26
机器人也能像人一样理解世界:中科院团队让AI机器人仅用3次演示就学会复杂操作
中科院团队开发的BridgeVLA系统实现了机器人学习的重大突破,仅需3次演示就能让机器人掌握复杂操作技能,成功率达96.8%。该系统通过巧妙的输入输出对齐设计和创新的预训练策略,让机器人能够真正理解三维空间和语言指令,为智能机器人的普及应用奠定了重要基础。
至顶网
科技行者 2025-06-20 10:25:47
百度谭待:区块链可以与人工智能、大数据互相促进发挥更大价值
谭待认为,区块链浪潮的来临并不是要取代互联网,而是让互联网发展得更好,区块链可以作为价值互联网的重要基础设施去推动互联网新一轮的进化,而且在技术上区块链可以与人工智能、大数据互相促进发挥更大的价值。
至顶网
至顶网存储频道 2018-07-10 16:05:19
矩阵乘法算法的新突破:俄罗斯程序员打造开源工具,在小格式计算中超越传统方法
俄罗斯系统程序设计研究所开发的开源C++框架,使用翻转图方法发现快速矩阵乘法算法。该框架支持多种系数环,通过位级编码和并行搜索,改进了79个算法方案的复杂度,发现了新的4×4×
10
算法,并将276个方案转换为高效的三元整数系数形式。
至顶网
科技行者 2026-03-04 15:05:16
加州大学洛杉矶分校提出NAMO优化器:用"信号强度调节器"让AI训练更稳定高效
加州大学洛杉矶分校研究团队提出NAMO和NAMO-D优化器,首次将Adam的噪声适应能力与Muon的矩阵结构处理优势有机结合。在GPT-2训练实验中,相比AdamW基线,训练损失改进约3-4%,同时具备更好的超参数鲁棒性和更低的计算开销。研究提供了完整的理论收敛保证,并开源了实现代码,为深度学习优化提供了实用的新工具。
至顶网
科技行者 2026-02-24 10:34:40
查尔斯大学突破性发现:同声传译AI系统的评价标准终于有了答案
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
至顶网
科技行者 2025-10-14 12:12:11
当善良声音变身恶意武器:AIM Intelligence团队揭秘音频AI的隐藏危机
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
至顶网
科技行者 2025-08-13 14:37:47
北京市印发 《5G 产业发展行动方案》:到2022年,我市运营商5G网络投资超300亿
1月22日晚,北京市经济和信息化局印发《北京市5G产业发展行动方案(2019年-2022年)》,方案确定了网络建设目标:到2022年,北京市运营商5G网络投资累计超过300亿元,实现首都功能核心区、城市副中心、重要功能区、 重要场所的5G网络覆盖。
至顶网
至顶网软件频道 2019-01-24 13:48:18
<
上一页
688
689
690
691
692
693
694
695
696
697
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号