搜索大发玩大小单双的有人带么【罔芷:——88pk·ee—

苹果公司颠覆蛋白质折叠：SimpleFold让复杂生物学变得简单如变魔术

苹果公司发布SimpleFold，这是首个基于流匹配的蛋白质折叠模型，完全使用通用Transformer架构。该模型摒弃了传统方法中的多序列比对、配对表示等复杂组件，在保持竞争性能的同时实现了20倍以上的计算效率提升。SimpleFold支持多样性结构生成，在标准基准测试中表现出色，并展现良好的扩展性。

至顶网科技行者 2025-10-15 12:07:58

宾大研究团队开发PIXIE：让计算机仅通过视觉就能预测物理世界的"物理大师"

宾夕法尼亚大学研究团队开发出PIXIE系统，这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒，准确率提升高达4.39倍，并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集，为相关技术发展奠定了重要基础，在游戏开发、机器人控制等领域具有广阔应用前景。

至顶网科技行者 2025-09-02 16:03:37

香港大学与字节跳动联手打造的Goku：让AI同时掌握图片和视频生成的"变形金刚"

香港大学与字节跳动联合开发了名为Goku的AI模型，能够同时生成高质量图片和视频。该模型采用修正流技术和统一训练架构，使用1.6亿张图片和3600万段视频训练，在多项评测中达到业界领先水平，在VBench视频测试中获得84.85分，GenEval图片测试中达到0.76分，展现了AI视觉生成技术向通用化发展的新趋势。

至顶网科技行者 2025-08-25 14:27:23

哈佛大学研究突破：训练AI时"删除"不良概念，让模型变得更安全可靠

哈佛大学研究团队开发出革命性的"概念消融微调"技术，能在AI训练过程中精准识别并移除有害概念，就像外科手术般精确。该技术成功解决了AI"意外学习"问题，让模型在掌握目标技能的同时避免不良行为，有害响应率降低90%。这为创造更安全可靠的AI系统提供了新路径。

至顶网科技行者 2025-07-28 10:15:58

机器人也能学会"七十二变"？清华大学团队让机器人从视频中学会灵巧操作

清华大学研究团队开发了HERMES系统，让机器人能通过观看人类操作视频学会复杂双手协作任务。该系统融合多源数据，采用通用奖励机制和虚实结合训练方法，配备精确导航定位能力。实验显示平均成功率达67.8%，在医疗、制造、家庭服务等领域展现广阔应用前景，代表了机器人从数据驱动向理解式学习的重要进展。

至顶网科技行者 2025-09-05 10:12:55

LMU Munich等机构重磅突破：让超级AI助手在手机上安家的全新联邦学习技术

这项由德国慕尼黑大学等机构联合完成的研究提出了FedNano框架，创新性地解决了多模态大语言模型在联邦学习中的部署难题。通过将模型拆分为服务器端核心和客户端轻量级NanoEdge模块，结合Fisher合并技术处理数据异质性，实现了95%的存储减少和99%的通信优化，同时保持了优异性能，为AI技术的普及化应用开辟了新路径。

至顶网科技行者 2025-06-24 15:44:05

上海AI实验室团队突破视觉推理难题：让AI也能像人类一样"看图解题"

上海AI实验室团队开发的MM-Eureka突破了多模态视觉推理难题，这是一个能同时理解图像和文字并进行复杂推理的AI系统。通过创新的强化学习训练策略和高质量的MMK12数据集，MM-Eureka不仅在数学推理上表现出色，还展现出惊人的跨学科推理能力，在物理、化学、生物等领域都有优异表现，性能接近OpenAI的o1模型。研究团队将所有成果完全开源，为AI研究社区提供了宝贵资源。

至顶网科技行者 2025-08-01 10:15:26

南洋理工大学团队重大突破：让AI像人类一样"会反思"的GUI自动化智能体

这项来自南洋理工大学和商汤科技的开创性研究，首次系统性地为GUI自动化AI赋予了人类般的自我反思和错误纠正能力。通过创新的三阶段训练框架和自动化数据生成技术，成功让AI学会了识别错误、撤销操作和从失败中学习，在复杂任务上的成功率提升了138%。这一突破不仅推动了GUI自动化技术的发展，更为构建真正智能的AI系统提供了新的范式。

至顶网科技行者 2025-06-12 08:09:39

阿里巴巴Qwen2.5-VL：让AI看懂世界的新一代视觉语言模型

阿里巴巴Qwen团队发布的Qwen2.5-VL是新一代多模态大型语言模型，实现了原生动态分辨率处理、超长视频理解和精确设备操作等突破。该模型提供3B、7B、72B三个版本，在文档理解、视觉定位、多语言处理等任务上达到业界领先水平，训练数据规模扩展至4.1万亿标记，为用户提供更智能实用的AI助手体验。

至顶网科技行者 2025-08-26 12:02:44

人大研究团队颠覆传统：不用巨型AI模型，也能轻松理解超长视频内容

这项由中国人民大学团队主导的研究提出了VideoDeepResearch框架，颠覆了长视频理解的传统方法。该系统采用文本推理模型配合多模态工具箱的设计，通过智能搜索策略实现对超长视频的精准理解，在多个权威测试中超越GPT-4o等顶级模型，同时显著降低计算成本，为视频AI应用开辟了新路径。

至顶网科技行者 2025-06-18 09:54:28

对话高通孟樸：自研Oryon CPU背后，是移动计算边界的再定义

骁龙峰会2024期间，高通中国区董事长孟樸接受了科技行者等媒体的采访，话题围绕自研芯片架构的故事、端侧AI的逻辑、汽车业务的布局、高通在中国市场的发展格局等内容展开。

至顶网周雅 2024-10-26 10:26:16

香港科技大学团队让电脑听音识画面：仅凭声音就能生成逼真视频

香港科技大学研究团队开发出SpA2V框架，这是首个能够从音频中提取空间信息并生成对应视频的AI系统。该技术不仅能识别声音类型，还能准确判断声源位置、移动方向和距离，通过两阶段生成过程实现"听音生画"。实验结果显示SpA2V在空间对应性和视频质量方面显著超越现有方法，为音频可视化、影视制作、教育应用等领域开辟了新的可能性。

至顶网科技行者 2025-08-07 10:21:55

当善良声音变身恶意武器：AIM Intelligence团队揭秘音频AI的隐藏危机

AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞，开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容，成功率超过86%，完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险，对全球数十亿智能设备构成潜在威胁。

至顶网科技行者 2025-08-13 14:37:47

MiniCPM4：小身材大能量，OpenBMB团队让AI模型跑进手机时代

OpenBMB团队推出MiniCPM4，通过稀疏注意力、高质量数据处理等四大创新维度，实现8B参数模型仅用22%训练数据达到竞争对手性能，并在端侧设备上实现7倍推理加速。该研究涵盖InfLLM v2架构、UltraClean数据技术、ModelTunnel v2训练优化和CPM.cu推理系统，展示了端侧AI的巨大潜力。

至顶网科技行者 2025-06-12 13:06:39

「人间清醒」80后程序员川哥

在一个焦虑的环境里，做一个淡定从容的人。

至顶网至顶网码客人生频道 2022-05-27 15:14:34

只需输入音频就能生成说话人视频？昆仑集团推出的Skywork R1V让AI同时看懂图片和推理数学

昆仑公司Skywork AI团队开发的Skywork R1V模型，成功将文本推理能力扩展到视觉领域。该模型仅用380亿参数就实现了与大型闭源模型相媲美的多模态推理性能，在MMMU测试中达到69.0分，在MathVista获得67.5分，同时保持了优秀的文本推理能力。研究团队采用高效的多模态迁移、混合优化框架和自适应推理链蒸馏三项核心技术，成功实现了视觉理解与逻辑推理的完美结合，并将所有代码和权重完全开源。

至顶网科技行者 2025-07-16 10:00:07

伊利诺伊大学新突破：让机器像法官一样剖析复杂争议，不再简单判"真假"

伊利诺伊大学研究团队开发了CLAIMSPECT系统，通过层次化分解复杂争议、智能检索相关文献、多角度收集观点的方法，将传统的"真假"判断转变为多维度分析。该系统能够自动构建争议话题的分析框架，识别不同观点及其支撑证据，为科学和政治争议提供更全面客观的分析，已在生物医学和国际关系领域验证有效性。

至顶网科技行者 2025-06-18 13:07:24

Skywork AI团队：一个1.5B参数的小模型如何同时掌握图像理解、生成和编辑三项绝技

Skywork AI团队开发出参数仅1.5亿的统一多模态模型Skywork UniPic，能同时完成图像理解、文字生成图像和图像编辑三项任务。该模型采用创新的双编码器架构，在多个基准测试中达到先进水平，且能在消费级硬件上运行，为多模态AI的普及化应用提供了新方案。

至顶网科技行者 2025-08-08 11:54:22

Sber AI团队突破视频生成瓶颈：让超高清视频制作快2.7倍的神奇算法

俄罗斯Sber AI团队开发出NABLA算法，通过邻域自适应块级注意力机制实现AI视频生成2.7倍加速。该算法采用三步优化：降维侦察、智能筛选和精确映射，动态识别重要注意力区域，在保持视频质量的同时大幅减少计算开销，为高效AI视频生成提供新解决方案。

至顶网科技行者 2025-07-29 17:15:17

南洋理工大学团队革命性突破：让AI绘画像艺术家一样从粗到细，一步步创作精美图像

南洋理工大学研究团队开发的NVG技术革新了AI图像生成方式，让AI学会像画家一样分层创作。该技术将图像分解为9个粒度层次，从整体构图到精细细节逐步生成，不仅提高了图像质量，还提供了前所未有的结构控制能力。在多项评测中NVG均优于现有方法，仅需9步即可生成高质量图像，为数字艺术创作和AI可控生成开辟了新路径。

至顶网科技行者 2025-08-27 10:00:48