搜索 AG手机客户端登录【網纸——YB233典CN—

布尔诺工业大学团队突破语音识别瓶颈：让机器更准确理解人类话语的新方法

布尔诺工业大学研究团队开发了DeCRED方法，通过在语音识别系统解码器中添加辅助监督，显著提升了系统在未知领域的泛化能力。该方法将域外测试错误率从18.2%降至16.2%，仅用1.72亿参数就达到了接近大型模型的性能。

至顶网科技行者 2025-08-15 08:29:33

SonicMaster：新加坡科技设计大学团队让破音音乐起死回生的神奇技术

新加坡科技设计大学研究团队开发出SonicMaster，这是首个支持自然语言控制的统一音频修复系统。该系统能够同时处理音乐录制中的19种常见问题，包括混响、削波、频响不平衡等，用户只需用普通话描述需求即可获得专业级处理效果。研究团队构建了包含17.5万音频样本的训练数据集，测试显示系统在客观指标和主观听感上均显著优于传统方法，为音频处理技术的普及应用提供了新思路。

至顶网科技行者 2025-08-08 13:06:28

黄仁勋北京媒体会：如何用十个AI方法论改变世界？

黄仁勋于昨天（7月16日）参加了在北京举行的第三届链博会，并于下午举行了长达90分钟的记者会。

至顶网至顶AI实验室 2025-07-17 08:35:46

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"，一个模型懂36种语言还能精准定位

谷歌DeepMind团队开发的SigLIP 2是新一代多语言视觉-语言编码器，支持36种语言的图像理解。通过创新的分阶段训练方法，结合解码器训练、自蒸馏学习和智能数据筛选，实现了在零样本分类、图像检索、精准定位等任务上的全面突破。该系统还采用去偏见技术，显著提升了文化公平性，为全球化AI应用奠定重要基础。

至顶网科技行者 2025-08-26 10:18:38

关山不再难越，IBM公有云为中国出海企业提供最佳路径

IBM将继续聚焦这个时代最具变革性的企业技术——混合云和AI ，帮助出海客户一次构建、随处运行和托管他们的关键工作负载，提供无缝体验，帮助他们把 AI 的能力注入其技术架构、系统和业务流程中，全力支持中国出海企业的全球化发展。

至顶网业界供稿 2023-03-23 16:49:06

MIT：让AI画画也能"抄近路"——从256步到20步的图像生成革命

MIT研究团队突破传统AI图像生成瓶颈，开发出局部感知并行解码技术，将生成步骤从256步减少至20步，速度提升12.8倍。该技术通过发现AI绘图中的空间局部性规律，重新设计了生成架构，让AI能够同时在多个区域并行"作画"而不影响质量，为实时图像生成应用开辟新道路。

至顶网科技行者 2025-07-04 17:20:25

OPPO研究团队突破AI智能体技术瓶颈：首个系统性评估框架让AI助手真正"智能"起来

OPPO研究团队通过系统性实验发现当前AI智能体研究缺乏统一标准，开发出模块化的OAgents框架，在GAIA基准测试中达到73.93%的领先成绩。该研究建立了严格的评估协议，将智能体能力分为事实获取和逻辑推理两个维度，为行业提供了标准化的工具和方法，推动AI智能体研究走向科学化和规范化。

至顶网科技行者 2025-06-26 12:52:10

蚂蚁集团包容性AI团队重磅发布Ming-Omni：首个媲美GPT-4o的开源全能AI模型

这项由蚂蚁集团包容性AI团队完成的研究发布了Ming-Omni，这是首个媲美GPT-4o的开源多模态AI模型。该模型能够同时处理文字、图像、音频和视频，并具备语音和图像生成能力。采用MoE架构和模态特定路由器，仅需激活2.8B参数就能达到与7B参数模型相当的性能。在多项基准测试中创造新纪录，特别是在语音理解、图像生成和多模态融合方面表现突出。

至顶网科技行者 2025-06-18 09:23:26

会议观察 | 2023世界人工智能大会WAIC精彩回顾

2023世界人工智能大会WAIC在上海召开。

至顶网孙硕 2023-07-14 11:36:05

斯坦福大学发布新一代GloVe词向量：十年后的语言"翻译官"大升级

斯坦福大学NLP研究小组发布了全新的2024版GloVe词向量，这是对2014年原版的重大升级。新版本使用维基百科、Gigaword新闻数据和Dolma语料库进行训练，新增超过70万词汇，涵盖疫情、科技、网络文化等现代概念。测试显示新版本在处理当代文本、非西方人名地名和社交媒体内容方面表现显著优于旧版本，为自然语言处理应用提供了更准确的语言理解工具。

至顶网科技行者 2025-07-29 12:03:43

用AI"慧眼"保护非洲野生动物：从传统CNN到视觉变换器的技术革命

这项由尼日利亚阿雷瓦数据科学学院主导的国际研究，通过对比DenseNet、ResNet、EfficientNet和Vision Transformer四种深度学习模型，为非洲野生动物保护提供了AI技术解决方案。研究发现DenseNet-201在实用性和准确率间达到最佳平衡，并成功部署了在线识别应用，为AI技术服务野生动物保护事业提供了完整的从理论到实践的范例。

至顶网科技行者 2025-08-05 13:21:09

探寻魔都“引力场”：AI创新者为何在这片土地集体找到归属感？

这两家公司，一个是向内拷问人性的AI先锋，一个是向外探索物理极限的AI长跑者，却都将事业锚点，落在漕河泾开发区时，一个题目浮现了：这片土地的科创引力从何而来？

至顶网周雅 2025-07-24 16:29:03

AI的故事：半人马的诞生之路

我们将讲述AI的一位被遗忘的“表亲”——IA，即智能增强。长久以来，人们思考的一直是人类大脑如何对抗人工硅脑的问题。但在IA层面，我们需要探讨的则是如何让人类大脑与人工硅脑共同合作。

至顶网科技行者 2018-03-09 14:29:33

新加坡团队突破！一张照片秒变4D世界：让静态画面"活"起来的黑科技

新加坡南洋理工大学团队开发的4DNeX系统实现了从单张照片生成完整4D动态场景的突破。该技术采用6D视频表示法融合RGB颜色和XYZ空间信息，构建了包含920万帧数据的4DNeX-10M大规模数据集，通过改进视频扩散模型实现15分钟内的高效生成，在动态程度和一致性指标上显著优于现有方法，为虚拟现实、影视制作等领域提供了新的技术路径。

至顶网科技行者 2025-08-26 14:18:34

让记忆力超群的人工神经网络"记住"更多：意大利比萨大学团队破解深度学习记忆难题

意大利比萨大学研究团队开发出深度残差回声状态网络（DeepResESN），通过创新的"时间残差连接"技术解决了深度神经网络的长期记忆问题。该方法在记忆性任务上性能提升65%以上，同时保持了储层计算训练快速的优势。研究提供了完整的数学理论分析和三类任务的实验验证，为需要长期记忆的AI应用（如天气预测、医疗诊断、金融分析）提供了新的技术选择。

至顶网科技行者 2025-09-08 10:16:49

多模态AI学会了自己"动手"：清华、科大携手Kwai发布会自主编程处理图像的智能助手

清华、中科大联合Kwai团队开发的Thyme系统实现了多模态AI的重大突破，让AI模型具备了自主编写代码处理图像和进行数学计算的能力。通过创新的两阶段训练策略和GRPO-ATS算法，Thyme在近20个评测基准上都表现出显著性能提升，特别是在高分辨率图像处理和复杂推理任务中表现突出，代表了AI从被动"看图说话"向主动"动手解决问题"的重要转变。

至顶网科技行者 2025-08-19 12:35:48

DreamCube：香港大学团队突破传统，让AI从一张照片"脑补"出整个360度世界

香港大学团队突破性地解决了AI全景图生成中的拼接难题，提出DreamCube系统，能从单张照片生成包含深度信息的完整360度场景。该研究创新性地引入"多平面同步"技术，让AI同时协调处理立方体六个面，避免传统方法的色差和断裂问题，实现从2D图像到3D场景的快速转换，为VR/AR、游戏开发、建筑设计等领域提供了全新的内容创作工具。

至顶网科技行者 2025-06-25 13:31:14

杉数科技拓荒国产「求解器」：用数学最优解，解商业最难题

研究求解器的少数者。

至顶网周雅 2022-09-30 11:01:43

杉数科技拓荒国产「求解器」：用数学最优解，解商业最难题

研究求解器的少数者。

至顶网周雅 2022-09-30 09:56:03

在华为的试用期，我决定离职

欲戴王冠，必承其重。

至顶网 Bai Bing 2022-06-14 11:27:01