用了 0.120850秒,为您找到mg 性价比 最高 高达 網纸 YB233相关内容9826 条
  • 贝壳研究院32B模型突破:用开源数据打造推理能力媲美超大模型的"小巧强兵"

    贝壳找房开发的AM-Thinking-v1是一个32B参数的推理优化语言模型,完全基于开源数据训练。该模型在数学推理和代码生成任务上表现出色,AIME2024得分85.3,超越了671B的DeepSeek-R1,证明了通过精心设计的训练流程,中等规模密集模型也能达到超大模型的推理能力。
    至顶网  科技行者  2025-07-09 11:56:44  
  • “云登顶” 圆了千万人的珠峰登顶梦

    这是“云端赏珠峰”呈现的美景。数千万足不出户的人们通过这一24小时实时景观且360度全景呈现的珠峰云直播,以“身临其境”的方式领略了不同时段下珠峰变幻莫测的盛景,体验了珠穆朗玛峰的壮美与险峻。
    至顶网  戴尔易安信解决方案  2020-11-23 18:09:21  
  • 为什么又是腾讯?

    腾讯主攻政务市场数字化的WeCity项目,先后拿下广东省政府10亿大单、长沙政府市5.2亿和成都市政府8.7亿大单,如果没有微信这个超级入口,以及庞大的技术支撑,是根本不可能的。这背后体现的当然是一家公司C to B的综合能力。
    至顶网  业界供稿  2020-05-29 12:20:07  
  • 大手笔收购:可编程逻辑与赛灵思IP在AMD麾下如何立功?

    AMD对赛灵思的收购已经完成,最终成本接近490亿美元——这个数字远远高于2020年10月刚刚宣布交易时预估的350亿美元。多花的钱,自然就是过去一年半以来AMD优异市场表现带来的股价上涨。
    至顶网  业界供稿  2022-02-17 14:57:34  
  • 慧据价值 链接未来丨第八届数据技术嘉年华大会再聚数据群英盛大开启

    时光荏苒,岁月如梭,然而技术的进步同样日新月异,转眼又来到总结一年的时刻,第八届数据技术嘉年华大会将于2018年11月16日~17日在北京市朝阳区东三环中路61号富力万丽酒店盛大开启。
    至顶网  业界供稿  2018-09-28 16:47:35  
  • 一个字就能节省千个字:低秩克隆技术实现高效知识蒸馏,哈尔滨工业大学研究提升小型语言模型效率

    这篇论文介绍了一种名为"低秩克隆"(LRC)的新型知识蒸馏方法,能极大提升小型语言模型的训练效率。哈尔滨工业大学深圳校区和百度公司的研究团队通过训练可学习的低秩投影矩阵,同时实现了软剪枝和激活克隆,避免了传统方法中的信息损失和对齐效率低下问题。实验证明,仅用100亿-200亿文本单元训练的LRC模型性能可匹配或超越需要万亿级训练数据的现有模型,训练效率提升1000倍以上,为资源受限场景下的高性能语言模型开发提供了突破性解决方案。
    至顶网  科技行者  2025-05-23 15:25:06  
  • 清华硕八面字节被拒,计算机应届生进厂打工

    计算机应届毕业生,找不到工作了?
    至顶网  杨淼  2024-11-01 10:04:12  
  • 脑部核磁共振正片加强!波尔多大学研发通过强化学习驱动大语言模型的神经退行性痴呆症可解释诊断框架

    法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
    至顶网  科技行者  2025-06-01 08:08:16  
  • 新场景、新应用引领行业迈向“算力”之春 | 联想创投CEO年会

    这个春天,基于大模型技术的应用成为科技圈的风暴眼,以ChatGPT为代表的生成式AI一瞬间成为科技圈顶流,而在其背后,更需要强大算力作为基础性支撑。
    至顶网  业界供稿  2023-03-07 15:59:03  
  • 压缩表示的统一缩放定律:从ISTA和Red Hat AI的研究中探索AI模型压缩的本质

    ISTA和Red Hat AI的研究团队在《Unified Scaling Laws for Compressed Representations》论文中提出了一个革命性的统一框架,揭示了AI模型压缩背后的数学规律。他们发现,无论使用什么压缩方法,模型性能都可以通过"表示容量"这一单一指标准确预测,而这一指标与表示法拟合随机高斯数据的能力直接相关。研究不仅证明了容量在组合表示中可以分解,还开发了基于容量的改进稀疏训练方法,在同等参数条件下显著提升模型性能。
    至顶网  科技行者  2025-06-06 11:22:39  
  • 算力基础设施的风险与挑战

    文章讨论了算力网络的愿景,即算力标准化、统一计量,类比电力网络。强调算力基础设施对数字化转型的重要性,但也面临标准化难题、技术门槛高、快速迭代等挑战。提出开放技术栈和产业链,以及算力网公司的竞争态势,强调软硬件融合和算力芯片独立自主的重要性。
    至顶网  软硬件融合  2024-05-29 11:04:46  
  • 从分子光谱到完整结构:中科院团队用AI突破百年化学难题

    中科院团队开发出DiffSpectra系统,首次实现仅通过多模态光谱数据就能准确推断分子完整三维结构的AI技术。该系统同时处理红外、拉曼和紫外光谱,采用扩散模型直接生成分子结构,突破了传统依赖分子库查找的局限。测试显示16.01%完全准确率,前20候选准确率达96.86%,将revolutionize化学分析效率,加速新药研发和材料科学发展。
    至顶网  科技行者  2025-07-18 09:36:14  
  • 分布式还是集中式?仁济医院部署IBM LinuxONE的启示录

    高岑说,“IBM试图在分布式架构和集中式架构之间打造这样一个‘桥梁’,为用户提供既保证高可用性、超强的纵向扩展能力,又提供快速顺应市场环境要求,缩短开发周期,灵活开源的最新横向扩展技术。”
    至顶网  李祥敬  2018-09-29 10:11:27  
  • M-A-P团队发布COIG-P:首个百万级中文人工智能偏好训练数据集,重新定义AI中文对话能力

    M-A-P团队发布的COIG-P数据集包含100万个高质量中文偏好样本对,通过15个AI模型协作生成和8个AI评委评分构建。该数据集覆盖对话、编程、数学等六大领域,显著提升了中文AI模型性能,相关模型在AlignBench评测中获得2%-12%的性能提升。团队还开源了中文奖励模型CRM和评估基准CRBench,为中文AI社区提供了重要的开源基础设施。
    至顶网  科技行者  2025-07-15 09:59:24  
  • 当AI造假遇上"不死水印":斯坦福团队破解视觉伪装攻击的终极防线

    斯坦福等高校联合研究团队首次开发出能抵御"视觉伪装攻击"的AI图像水印技术PECCAVI。该技术通过识别图片中的"非融化点"并采用多频道频域水印,成功抵御了能完全去除传统水印的最新攻击方式,检测率达92%。研究解决了AI生成图像真实性验证的关键难题,为防范AI造假内容传播提供了重要技术支撑。
    至顶网  科技行者  2025-07-03 13:56:14  
  • 亚马逊云科技助力三七互娱出海,文化“出圈”

    如果问,在众多的中国出海赛道中哪一条拥有基数最大的粉丝拥趸?以网络游戏、社交媒体、直播、短视频为代表的泛娱乐赛道便成为当仁不让的领跑者。
    至顶网  业界供稿  2023-11-21 12:12:09  
  • “卡脖子”两周年盘点之——本土EDA“夹缝”中的舞蹈

    本土EDA需要在差异化、“夹缝”中的需求里,获得成长的空间。
    至顶网  毛烁  2023-09-04 16:09:18  
  • 让计算机学会"量身定制"的思考:KAIST开发的智能递归深度调节系统

    KAIST研究团队开发了名为MoR的智能递归深度调节系统,该系统能够根据词语复杂程度自动分配计算资源,实现了参数共享、自适应计算和智能缓存的统一。实验显示,MoR在使用更少参数的情况下仍能提升准确率1-2个百分点,处理速度提升20-100%。这项技术为AI发展提供了新的高效计算模式。
    至顶网  科技行者  2025-07-22 09:24:58  
  • 英特尔架构日回顾:关于芯片巨头的广度、深度与未来

    英特尔新近召开的架构日活动可以用“琳琅满目”来概括。借此机会,芯片巨头发布了新的CPU核心、加速计算块、处理器与显卡背后的技术细节,同时介绍了与这些处理器及显卡对应的跨PC、服务器、存储及商业/消费应用网络的软件。总之,就是“琳琅满目”。
    至顶网  业界供稿  2021-08-24 14:15:05  
  • 让AI像自来水一样简单,华为云通用AI解决方案体验

    通用AI的应用前景非常广阔,它可以在医疗、交通、金融、教育、娱乐等各个领域发挥作用,为人类带来更好的生活体验和更高效的工作方式。
    至顶网  至顶网云计算频道  2023-06-28 11:10:32  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号