搜一下
用了 0.055057秒,为您找到
AG
手机
客户端
登录
網纸
YB233
相关内容4408 条
布尔诺工业大学团队突破语音识别瓶颈:让机器更准确理解人类话语的新方法
布尔诺工业大学研究团队开发了DeCRED方法,通过在语音识别系统解码器中添加辅助监督,显著提升了系统在未知领域的泛化能力。该方法将域外测试错误率从18.2%降至16.2%,仅用1.72亿参数就达到了接近大型模型的性能。
至顶网
科技行者 2025-08-15 08:29:33
SonicMaster:新加坡科技设计大学团队让破音音乐起死回生的神奇技术
新加坡科技设计大学研究团队开发出SonicMaster,这是首个支持自然语言控制的统一音频修复系统。该系统能够同时处理音乐录制中的19种常见问题,包括混响、削波、频响不平衡等,用户只需用普通话描述需求即可获得专业级处理效果。研究团队构建了包含17.5万音频样本的训练数据集,测试显示系统在客观指标和主观听感上均显著优于传统方法,为音频处理技术的普及应用提供了新思路。
至顶网
科技行者 2025-08-08 13:06:28
黄仁勋北京媒体会:如何用十个AI方法论改变世界?
黄仁勋于昨天(7月16日)参加了在北京举行的第三届链博会,并于下午举行了长达90分钟的记者会。
至顶网
至顶AI实验室 2025-07-17 08:35:46
谷歌DeepMind让AI大脑学会了超强"语言视觉连接",一个模型懂36种语言还能精准定位
谷歌DeepMind团队开发的SigLIP 2是新一代多语言视觉-语言编码器,支持36种语言的图像理解。通过创新的分阶段训练方法,结合解码器训练、自蒸馏学习和智能数据筛选,实现了在零样本分类、图像检索、精准定位等任务上的全面突破。该系统还采用去偏见技术,显著提升了文化公平性,为全球化AI应用奠定重要基础。
至顶网
科技行者 2025-08-26 10:18:38
关山不再难越,IBM公有云为中国出海企业提供最佳路径
IBM将继续聚焦这个时代最具变革性的企业技术——混合云和AI ,帮助出海客户一次构建、随处运行和托管他们的关键工作负载,提供无缝体验,帮助他们把 AI 的能力注入其技术架构、系统和业务流程中,全力支持中国出海企业的全球化发展。
至顶网
业界供稿 2023-03-23 16:49:06
MIT:让AI画画也能"抄近路"——从256步到20步的图像生成革命
MIT研究团队突破传统AI图像生成瓶颈,开发出局部感知并行解码技术,将生成步骤从256步减少至20步,速度提升12.8倍。该技术通过发现AI绘图中的空间局部性规律,重新设计了生成架构,让AI能够同时在多个区域并行"作画"而不影响质量,为实时图像生成应用开辟新道路。
至顶网
科技行者 2025-07-04 17:20:25
OPPO研究团队突破AI智能体技术瓶颈:首个系统性评估框架让AI助手真正"智能"起来
OPPO研究团队通过系统性实验发现当前AI智能体研究缺乏统一标准,开发出模块化的OAgents框架,在GAIA基准测试中达到73.93%的领先成绩。该研究建立了严格的评估协议,将智能体能力分为事实获取和逻辑推理两个维度,为行业提供了标准化的工具和方法,推动AI智能体研究走向科学化和规范化。
至顶网
科技行者 2025-06-26 12:52:10
蚂蚁集团包容性AI团队重磅发布Ming-Omni:首个媲美GPT-4o的开源全能AI模型
这项由蚂蚁集团包容性AI团队完成的研究发布了Ming-Omni,这是首个媲美GPT-4o的开源多模态AI模型。该模型能够同时处理文字、图像、音频和视频,并具备语音和图像生成能力。采用MoE架构和模态特定路由器,仅需激活2.8B参数就能达到与7B参数模型相当的性能。在多项基准测试中创造新纪录,特别是在语音理解、图像生成和多模态融合方面表现突出。
至顶网
科技行者 2025-06-18 09:23:26
会议观察 | 2023世界人工智能大会WAIC精彩回顾
2023世界人工智能大会WAIC在上海召开。
至顶网
孙硕 2023-07-14 11:36:05
斯坦福大学发布新一代GloVe词向量:十年后的语言"翻译官"大升级
斯坦福大学NLP研究小组发布了全新的2024版GloVe词向量,这是对2014年原版的重大升级。新版本使用维基百科、Gigaword新闻数据和Dolma语料库进行训练,新增超过70万词汇,涵盖疫情、科技、网络文化等现代概念。测试显示新版本在处理当代文本、非西方人名地名和社交媒体内容方面表现显著优于旧版本,为自然语言处理应用提供了更准确的语言理解工具。
至顶网
科技行者 2025-07-29 12:03:43
用AI"慧眼"保护非洲野生动物:从传统CNN到视觉变换器的技术革命
这项由尼日利亚阿雷瓦数据科学学院主导的国际研究,通过对比DenseNet、ResNet、EfficientNet和Vision Transformer四种深度学习模型,为非洲野生动物保护提供了AI技术解决方案。研究发现DenseNet-201在实用性和准确率间达到最佳平衡,并成功部署了在线识别应用,为AI技术服务野生动物保护事业提供了完整的从理论到实践的范例。
至顶网
科技行者 2025-08-05 13:21:09
探寻魔都“引力场”:AI创新者为何在这片土地集体找到归属感?
这两家公司,一个是向内拷问人性的AI先锋,一个是向外探索物理极限的AI长跑者,却都将事业锚点,落在漕河泾开发区时,一个题目浮现了:这片土地的科创引力从何而来?
至顶网
周雅 2025-07-24 16:29:03
AI的故事:半人马的诞生之路
我们将讲述AI的一位被遗忘的“表亲”——IA,即智能增强。长久以来,人们思考的一直是人类大脑如何对抗人工硅脑的问题。但在IA层面,我们需要探讨的则是如何让人类大脑与人工硅脑共同合作。
至顶网
科技行者 2018-03-09 14:29:33
新加坡团队突破!一张照片秒变4D世界:让静态画面"活"起来的黑科技
新加坡南洋理工大学团队开发的4DNeX系统实现了从单张照片生成完整4D动态场景的突破。该技术采用6D视频表示法融合RGB颜色和XYZ空间信息,构建了包含920万帧数据的4DNeX-10M大规模数据集,通过改进视频扩散模型实现15分钟内的高效生成,在动态程度和一致性指标上显著优于现有方法,为虚拟现实、影视制作等领域提供了新的技术路径。
至顶网
科技行者 2025-08-26 14:18:34
让记忆力超群的人工神经网络"记住"更多:意大利比萨大学团队破解深度学习记忆难题
意大利比萨大学研究团队开发出深度残差回声状态网络(DeepResESN),通过创新的"时间残差连接"技术解决了深度神经网络的长期记忆问题。该方法在记忆性任务上性能提升65%以上,同时保持了储层计算训练快速的优势。研究提供了完整的数学理论分析和三类任务的实验验证,为需要长期记忆的AI应用(如天气预测、医疗诊断、金融分析)提供了新的技术选择。
至顶网
科技行者 2025-09-08 10:16:49
多模态AI学会了自己"动手":清华、科大携手Kwai发布会自主编程处理图像的智能助手
清华、中科大联合Kwai团队开发的Thyme系统实现了多模态AI的重大突破,让AI模型具备了自主编写代码处理图像和进行数学计算的能力。通过创新的两阶段训练策略和GRPO-ATS算法,Thyme在近20个评测基准上都表现出显著性能提升,特别是在高分辨率图像处理和复杂推理任务中表现突出,代表了AI从被动"看图说话"向主动"动手解决问题"的重要转变。
至顶网
科技行者 2025-08-19 12:35:48
DreamCube:香港大学团队突破传统,让AI从一张照片"脑补"出整个360度世界
香港大学团队突破性地解决了AI全景图生成中的拼接难题,提出DreamCube系统,能从单张照片生成包含深度信息的完整360度场景。该研究创新性地引入"多平面同步"技术,让AI同时协调处理立方体六个面,避免传统方法的色差和断裂问题,实现从2D图像到3D场景的快速转换,为VR/AR、游戏开发、建筑设计等领域提供了全新的内容创作工具。
至顶网
科技行者 2025-06-25 13:31:14
杉数科技拓荒国产「求解器」:用数学最优解,解商业最难题
研究求解器的少数者。
至顶网
周雅 2022-09-30 11:01:43
杉数科技拓荒国产「求解器」:用数学最优解,解商业最难题
研究求解器的少数者。
至顶网
周雅 2022-09-30 09:56:03
在华为的试用期,我决定离职
欲戴王冠,必承其重。
至顶网
Bai Bing 2022-06-14 11:27:01
<
上一页
213
214
215
216
217
218
219
220
221
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号