搜索 bob手机在线【網纸——YB233典CN—

让AI看图说话更详细更准确：上海人工智能实验室团队开发的ScaleCap技术突破

这项研究解决了AI图片描述中的两大难题：描述不平衡和内容虚构。通过创新的"侦探式追问"方法，让AI能生成更详细准确的图片描述，显著提升了多个AI系统的性能表现，为无障碍技术、教育、电商等领域带来实用价值。

至顶网科技行者 2025-06-27 17:00:35

苹果研究院首创AI音频技术：让声音拥有记忆力，语音助手即将迎来智能化革命

苹果公司研究团队开发出革命性语音AI技术RealTimeVoice，首次实现语音助手的完美记忆力和实时对话能力。该技术通过流式音频处理和创新的记忆缓存机制，让AI能够记住完整对话历史的同时保持快速响应，反应速度比传统系统提升一倍。这项突破将彻底改变人机语音交互体验，让数字助手真正成为理解用户的智能伙伴。

至顶网科技行者 2025-08-20 18:04:48

2023年，我还留在互联网大厂

对于多数人来说，大厂或许仍是工作的最优解。但也不得不正视大厂的光环的确在褪去。经历了大厂一波又一波的裁员，留下来的人似乎成为了“幸运儿”，只是“幸运”并不一定，压力却是必然。今日推荐燃次元（ ID :chaintruth ) 一篇文章，那些留在大厂的人们。

至顶网至顶网码客人生频道 2023-01-09 10:22:42

GLiNER2：小巧高效的信息提取神器，让AI文档处理从GPU"搬"到CPU

GLiNER2是Fastino AI开发的统一信息提取系统，仅用2亿参数就集成了命名实体识别、文本分类和层次化结构提取三大功能。该系统最大亮点是完全支持CPU运行，无需GPU显卡，处理速度比同类模型快40倍，准确率达到72%。采用Apache 2.0开源协议，用户可通过pip免费安装使用，为企业和个人提供了高效、安全、低成本的文档处理解决方案。

至顶网科技行者 2025-07-29 12:02:11

《数字经济洞察周报》2023年第18期 |全球生成式AI产业图谱及报告在第七届世界智能大会发布

第七届世界智能大会成功召开，全球生成式AI产业图谱及报告发布。

至顶网孙硕，吕敬儒 2023-05-26 17:10:33

会议观察 | 2023全球人工智能开发者先锋大会精彩回顾

2023全球人工智能开发者先锋大会在上海临港成功举办。

至顶网孙硕宿硕 2023-03-01 18:30:25

香港大学团队开源全球首个完整电脑操作AI框架：让机器像人一样使用电脑的时代来了

香港大学XLANG实验室联合多所知名院校开发的OPENCUA，是全球首个完整开源的电脑操作AI框架。该系统通过2.2万个真实操作录像训练，具备三层推理能力，能像人一样使用电脑完成复杂任务。在权威测试中超越OpenAI同类产品，为电脑自动化技术树立了新标杆。

至顶网科技行者 2025-08-15 08:26:56

抖音团队打造全新视觉语言AI：SAIL-VL2以小博大，2B参数也能媲美大模型

抖音SAIL团队联合新加坡国立大学开发的SAIL-VL2多模态AI模型，以2B-8B的紧凑参数实现了超越大型模型的性能。通过精心的数据筛选、渐进式训练和架构优化，在106个数据集测试中表现卓越，其中2B版本在4B以下开源模型中排名第一，8B-Thinking版本在推理任务上达到开源第一。该模型证明了"小而精"的发展路径，为AI技术的普及和高效部署提供了新思路。

至顶网科技行者 2025-09-29 14:30:19

印度理工学院新突破：让小模型也能像大模型一样聪明，无需标注数据的AI视觉问答训练法

印度理工学院团队开发出MPA模型对等对齐器，这是一种革命性的AI训练方法，能让小型视觉语言模型在无需人工标注数据的情况下，通过大模型指导显著提升性能。该技术通过三步法实现知识传递：大模型自动出题答题、精准识别知识差距、针对性强化训练。实验显示小模型性能提升高达15.2%，成本仅为传统方法的几十分之一，为AI技术普及开辟新路径。

至顶网科技行者 2025-09-29 08:52:08

耶鲁大学团队开发"虚拟细胞建筑师"：一台能独立设计生物实验的AI超级助手

这项研究开发了CellForge系统，通过多个AI专家协作自动化虚拟细胞建模全流程。系统在六种不同生物学场景测试中全面超越现有方法，预测误差最高降低40%，相关性提升20%。该技术将传统需要数月专家协作的工作压缩至几小时，成本从数千美元降至几美元，有望大幅降低科研门槛并加速生命科学发现。

至顶网科技行者 2025-10-10 10:29:08

Meta与卡内基梅隆大学携手打造ATLAS：让3D人体建模像调整游戏角色一样简单

Meta与卡内基梅隆大学联合开发的ATLAS系统革命性地解决了3D人体建模中的核心难题。通过将人体骨架和表面分离处理，ATLAS实现了精确的独立控制，避免了传统方法中调整一个部位影响其他部位的问题。该系统基于60万高分辨率扫描数据训练，采用创新的稀疏非线性姿态校正技术，能从单张照片生成精确3D模型，为虚拟现实、游戏制作、在线购物等应用提供强大技术支撑。

至顶网科技行者 2025-10-11 09:53:34

腾讯推出UloRL算法：让AI像人类专家一样深度思考，推理能力大幅提升

腾讯混元团队开发了UloRL算法，通过分段生成和动态遮蔽策略解决AI超长推理训练中的效率和质量问题。该方法让30B参数模型在数学推理任务上超越了更大的235B模型，准确率提升超14%，同时训练速度提升2倍。这项技术为AI深度推理能力发展提供了新路径。

至顶网科技行者 2025-08-05 10:35:15

利而不争，携手共生——英特尔的“待客之道”

英特尔客户充分发挥英特尔客户至上的价值观，站在客户的角度，从客户的实际应用需求出发，为客户匹配到最合适且最具性价比的解决方案，并通过与客户一道进行反复的沟通测试，真正验证了英特尔平台级解决方案在真实应用场景中的价值。

至顶网李祥敬 2020-10-26 11:57:25

网达软件：打开数字化世界之“眼”

[前言] 技术创新要通过赋能千行百业而体现，更需要无数创业者以新思路来呈现。GSMA 5G创新与投资平台（5G IN）推出「创业者说」系列访谈，携手新媒体平台科技行者，分享创业者的创新故事。

至顶网周雅 2021-03-16 15:20:56

人工智能终于学会说话了？阿里巴巴等机构突破语音理解技术壁垒！

阿里巴巴等机构联合发布LLaSO框架，这是首个完全开放的端到端语音理解系统。该框架包含2550万训练样本、20种语音任务，支持多模态交互，在标准化评估中获得0.72分，超越同类系统。LLaSO不仅提供完整数据和代码，还建立了统一评估标准，为语音AI研究提供了重要基础设施，推动了从语音识别向全面语音理解的技术跃升。

至顶网科技行者 2025-08-29 09:32:22

Spotify科学家破解推荐系统难题：用一套"语义身份证"让搜索和推荐完美融合

Spotify研究团队通过系统性实验发现，传统为搜索或推荐任务单独优化的语义身份证在统一系统中存在严重的性能冲突。他们提出的多任务训练方法能够同时学习查询匹配和用户行为预测，为每个物品生成既适合搜索又适合推荐的统一身份证，在两个任务中都达到良好平衡效果，为构建下一代生成式推荐系统提供了重要技术路径。

至顶网科技行者 2025-08-28 11:07:03

复旦大学推出BMMR数据集：让AI跨越知识鸿沟，从数学天才走向通识博士

复旦大学团队发布BMMR数据集，这是首个大规模跨学科多模态推理评估基准，包含11万个涵盖300个学科的大学水平问题。研究发现即使最先进的AI模型在跨学科推理中表现有限，揭示了当前AI发展的重要盲点。该数据集支持中英双语，配备专门的推理过程评估工具，为AI向通用智能发展提供重要支撑。

至顶网科技行者 2025-07-11 10:15:30

有想象的地方，就有视频云

2021,阿里云视频云全景创新峰会,努力尝试站在近景和远景之处,全景观察这个时代的超视频化课题。

至顶网业界供稿 2021-07-15 17:20:50

AI训练新模式：群体智慧让小型语言模型变得更聪明——Gensyn团队的分布式协作训练突破

Gensyn团队提出SAPO分布式AI训练方法，让普通设备通过分享学习经验协作训练语言模型。实验显示，采用50%本地和50%外部经验的均衡策略，小型AI模型性能提升94%。该方法避免了传统分布式训练的同步瓶颈，为AI训练民主化开辟新路径。

至顶网科技行者 2025-09-25 10:32:03

印度裔创业者视角：Perplexity创始人谈技术迭代、开源竞争与搜索革命

最近我们留意到，阿拉温德在哈佛商学院2025创业峰会上，与Xfund管理合伙人Patrick Chung有一场深度对话，他大谈创业心得。从印度的电气工程学生，到改变搜索引擎格局的CEO，阿拉温德的故事提醒我们，在技术领域，最具变革性的创新，往往来自于能够跨越学术与商业鸿沟之处。

至顶网周雅 2025-04-26 22:37:21