搜索大发玩大小单双的有人带么【罔芷:——88pk·ee—

苹果公司的AXLearn：让AI巨型模型训练变得像搭积木一样简单

苹果公司研究团队开发了AXLearn，一个模块化的大型AI模型训练系统。该系统采用严格的组件封装设计，能在GPU、TPU、Trainium等异构硬件上运行，将添加新功能的代码量从数百行减少到10行，实现了常数级的复杂度增长。研究团队创造了"代码行复杂度"指标来量化模块化优势，并通过大规模实验证明了系统的高性能和扩展性。

至顶网科技行者 2025-07-18 09:33:29

挑战互联网 : 信息革命

人们曾经以采集食物为生，而如今他们要重新以采集信息为生，尽管这件事看起来很不可思议。——Marshall McLuhan

至顶网能链科技 2020-12-04 15:52:54

Writer公司突破性发现：大语言模型在金融领域的可靠性危机——FailSafeQA基准测试揭示AI系统的脆弱性

Writer公司研究团队通过FailSafeQA基准测试发现，即使最先进的AI模型在处理金融查询时也存在严重可靠性问题。测试涵盖24个模型，发现最优秀的系统仍有41%概率在信息不足时编造答案。该研究创新性地评估了AI系统在面对拼写错误、文档缺失、OCR错误等真实场景时的表现，揭示了当前AI技术在关键应用中的风险，为金融等行业的AI部署提供了重要安全参考。

至顶网科技行者 2025-08-26 10:18:25

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"，一个模型懂36种语言还能精准定位

谷歌DeepMind团队开发的SigLIP 2是新一代多语言视觉-语言编码器，支持36种语言的图像理解。通过创新的分阶段训练方法，结合解码器训练、自蒸馏学习和智能数据筛选，实现了在零样本分类、图像检索、精准定位等任务上的全面突破。该系统还采用去偏见技术，显著提升了文化公平性，为全球化AI应用奠定重要基础。

至顶网科技行者 2025-08-26 10:18:38

BiomedSQL：一个突破性文本转SQL框架，让生物医学研究者更轻松查询知识库

BiomedSQL是由NIH和DataTecnica团队开发的首个生物医学文本转SQL基准，专门评估大型语言模型在生物医学知识库查询中的科学推理能力。这项创新研究构建了一个包含68,000个问题-SQL-答案三元组的数据集，基于整合了基因疾病关联、组学数据和药物记录的BigQuery知识库。与通用文本转SQL系统不同，BiomedSQL测试模型是否能理解隐含的科学约定（如基因组显著性阈值为p<5e-08）并执行多步推理。

至顶网科技行者 2025-06-01 11:15:23

StepFun团队推出Step 3.5 Flash：用11B活跃参数实现前沿级智能的革命性突破

StepFun团队发布Step 3.5 Flash，这是一个稀疏专家混合模型，仅用110亿活跃参数就实现了前沿级智能水平。该模型采用创新的混合注意力机制和MIS-PO强化学习方法，在数学推理、代码生成和智能体任务中表现卓越，与GPT-5.2和Gemini 3.0 Pro等顶级模型性能相当，同时大幅提升了计算效率和部署便利性。

至顶网科技行者 2026-02-13 08:35:11

Peloton坎坷的成长之路

也许Peloton能否生存根本就不存在争议，真正的矛盾点在于高管团队和投资者们总指望着让Peloton带来天文数字的经济回报。

至顶网 The Verge 2024-04-12 09:54:58

StepFun推出Step1X-Edit：让AI图像编辑媲美GPT-4o的开源突破

StepFun公司推出的Step1X-Edit是首个能够媲美GPT-4o和Gemini2 Flash等商业模型的开源图像编辑AI。该模型通过整合多模态语言理解和扩散图像生成技术，能够处理11种编辑任务，在新构建的GEdit-Bench基准测试中表现优异，为图像编辑技术的民主化开辟了新道路。

至顶网科技行者 2025-07-16 23:13:27

MOLE：利用大语言模型从科学论文中提取和验证元数据的创新框架

MOLE是一个由KAUST研究团队开发的创新框架，利用大语言模型从科学论文中自动提取数据集元数据。与传统方法相比，MOLE能提取30多种不同元数据属性，支持多语言数据集，并提供严格的验证机制确保输出质量。研究测试了包括Gemini、GPT-4o等七种大模型，结果显示Gemini 2.5 Pro整体表现最佳。MOLE通过自动化元数据提取，使研究人员能更容易发现和使用适合的数据集，促进研究效率和科学开放性。

至顶网科技行者 2025-05-30 09:42:55

Meta首次突破：AI注意力机制终于学会"一心多用"，让计算机能同时关注多个线索

Meta公司FAIR实验室的研究团队提出了多令牌注意力机制，这是一种突破性的AI注意力计算方法。通过引入卷积操作，新机制让AI能够同时关注文本中的多个位置并协调整合信息，解决了传统注意力机制"一心一用"的根本局限。在大规模语言模型和长文本任务中，该技术显著提升了AI的信息检索和理解能力。

至顶网科技行者 2025-07-15 11:34:47

复旦大学联合团队发布GeometryZero：让小尺寸AI模型也能像数学天才一样解决几何难题

复旦大学联合多所知名院校开发了GeometryZero模型，通过创新的群体对比策略优化（GCPO）方法，让小尺寸AI模型具备了类似数学专家的几何推理能力。该模型能智能判断何时使用辅助构造工具，在多个几何基准测试中表现优异，为AI教育应用的普及化奠定了基础，展现了专门化训练的巨大潜力。

至顶网科技行者 2025-06-12 09:55:13

清华大学团队发明AI"注意力瘦身术"：视频生成速度提升16倍的神奇技术

这项由清华大学和加州大学伯克利分校联合完成的研究提出了SpargeAttention2技术，通过混合Top-k和Top-p掩码策略以及速度蒸馏微调法，实现了AI视频生成中95%的注意力稀疏度和16.2倍的速度提升，同时保持了生成质量。该技术有望大幅降低AI视频生成的计算成本，推动相关应用的普及。

至顶网科技行者 2026-02-24 15:52:50

探寻魔都“引力场”：AI创新者为何在这片土地集体找到归属感？

这两家公司，一个是向内拷问人性的AI先锋，一个是向外探索物理极限的AI长跑者，却都将事业锚点，落在漕河泾开发区时，一个题目浮现了：这片土地的科创引力从何而来？

至顶网周雅 2025-07-24 16:29:03

加州大学洛杉矶分校突破性研究：AI对话攻防战的多轮博弈新纪元

这项突破性研究首次系统性地揭示了多轮对话攻击对AI安全的严重威胁，开发了X-Teaming智能攻击框架和XGuard-Train防护数据集。研究显示当前AI系统面对精心设计的多轮攻击时失守率高达98%，但通过新构建的大规模训练数据集可将这一风险显著降低，为AI安全防护提供了重要工具和新思路。

至顶网科技行者 2025-07-11 15:23:04

亚马逊研究团队推出BeepBank-500：让电子音效研究变得像搭积木一样简单

亚马逊首席科学家Mandip Goswami发布BeepBank-500开源数据集，包含300-500个参数化合成电子音效，专为听觉界面研究设计。该数据集提供完整的元数据标注、可重现的生成脚本和基准测试，音频采用CC0-1.0许可证完全开放，填补了电子音效研究领域缺乏标准化工具的空白，为心理声学和人机交互研究提供了便捷的实验材料。

至顶网科技行者 2025-10-13 09:02:05

让AI看懂视频因果关系：女王大学突破视频推理技术壁垒

加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力，发现即使最先进的AI在理解视频中事件因果关系方面表现极差，大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench，并提出了识别-推理分解法（RRD），通过任务分解显著提升了AI性能，最高改善幅度达25.2%。

至顶网科技行者 2025-07-09 15:45:45

在华为的试用期，我决定离职

欲戴王冠，必承其重。

至顶网 Bai Bing 2022-06-14 11:27:01

在华为的试用期，我决定离职

欲戴王冠，必承其重。

至顶网 Bai Bing 2022-06-16 16:31:20

神州数码 21年的进化与进取

当其他企业还在低谷中上下求索的时候,二十余年来始终以“数字中国”为使命的神州数码集团,却在2022年一季度业绩大考中给出了营收增长19%、净利润增长20%的优异成绩。

至顶网业界供稿 2022-07-14 18:06:22

计算机视觉新突破：斯坦福大学让视频生成模型学会"追踪"物体运动

斯坦福大学研究团队开发了KL-tracing方法，能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记，利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中，相比传统方法性能提升16.6%，展现了大型生成模型在计算机视觉任务中的潜力。

至顶网科技行者 2025-07-22 13:23:34