搜一下
用了 0.091619秒,为您找到
奔驰
宝马
游戏
网站
bcbm
網纸
YB233
相关内容6793 条
微软造出AI播音员,单次录制90分钟多人对话!VIBEVOICE如何重新定义语音合成?
微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。该技术采用连续语音编码器实现3200倍压缩率,结合大语言模型和下一令牌扩散技术,支持最多4个说话者的自然对话生成。在多项评测中全面超越现有系统,为播客制作、有声读物等应用开辟新可能。
至顶网
科技行者 2025-09-03 11:38:22
当AI开始懂电影:上海人工智能实验室重新定义机器视觉的电影语言理解
上海人工智能实验室联合多所高校开发出首个AI电影语言理解评测平台ShotBench,发现当前最先进AI模型在专业视觉理解方面存在重大缺陷。团队构建7万样本数据集ShotQA,开发出突破性模型ShotVL,在电影语言理解上创造新纪录,为AI辅助视频制作和创意产业变革奠定基础。
至顶网
科技行者 2025-07-01 15:52:41
想让AI像人一样说话?谷歌DeepMind用魔法般的数据驱动方法让语音合成更自然!
谷歌DeepMind研究团队开发了革命性的语音合成技术,采用数据驱动方法让AI学会像人类一样自然说话。通过观察大量真实语音数据,新系统能够生成更自然、更有情感的语音,在客观测试和主观评价中都显著超越传统方法。这项技术将为智能助手、有声读物、教育软件等领域带来重大改进,同时为语言障碍人群提供帮助,展现了人机交互技术的光明前景。
至顶网
科技行者 2025-06-13 09:43:26
阿里通义实验室推出WebSailor:首个与顶级闭源系统媲美的开源超级网络智能体
阿里通义实验室发布首个媲美顶级闭源系统的开源超级网络智能体WebSailor,突破性解决开源模型在超高不确定性任务中的系统性推理难题,在BrowseComp基准测试准确率提升3倍,标志着开源技术在复杂信息搜索领域的历史性跨越。
至顶网
至顶AI实验室 2025-07-07 16:57:16
Peloton坎坷的成长之路
也许Peloton能否生存根本就不存在争议,真正的矛盾点在于高管团队和投资者们总指望着让Peloton带来天文数字的经济回报。
至顶网
The Verge 2024-04-12 09:54:58
大语言模型能否像人类一样产生意见分歧?苏黎世联邦理工学院团队揭示AI标注者的局限性
苏黎世联邦理工学院团队通过大规模实验发现,当前主流大语言模型在预测人类标注分歧方面存在显著局限。研究对比了RLVR和RLHF两类模型,发现RLVR模型虽然擅长处理标准化任务,但在理解观点多样性方面表现不佳。这一发现对AI标注系统的实际应用具有重要指导意义。
至顶网
科技行者 2025-06-30 10:52:42
Adobe Research团队重新定义长视频生成:从5秒到5分钟的技术突破之路
Adobe Research联合32家顶尖机构发布重磅研究,全面解析长视频生成技术现状与突破路径。研究发现当前AI视频生成存在时长限制(多数仅5-16秒)和质量衰减问题,通过分析六大技术流派和核心架构组件,为实现电影级长视频生成提供了系统性解决方案,预示着从几秒短片向几分钟完整故事视频的技术跃迁即将到来。
至顶网
科技行者 2025-07-21 10:02:02
清华大学提出MoveGCL:不用共享数据也能训练"全球通"人工智能出行模型
清华大学提出MoveGCL框架,首次实现在完全不共享敏感出行数据的前提下,多城市协作训练全球通用人工智能出行预测模型。该技术通过生成虚拟轨迹传递知识,结合混合专家系统和渐进式学习策略,在六个美国主要城市的测试中展现出优异性能,为隐私保护下的协作学习提供了新范式。
至顶网
科技行者 2025-06-18 09:21:20
全新MatePad Pro领衔 多款重磅新品亮相华为秋季全场景新品发布会
一直以来华为都坚持以消费者为中心,通过技术创新为用户带来功能更丰富、体验更优秀的科技产品。华为一直都非常重视科技研发,这也是华为产品的核心竞争力。
至顶网
业界供稿 2023-09-25 17:43:40
康奈尔大学惊人发现:大语言模型竟然能读懂"隐藏"的数据密码!
康奈尔大学研究团队发现,预训练的大语言模型具备惊人的"密码破解"能力,能够仅通过观察例子就自动学会识别和预测隐马尔可夫模型中的隐藏模式。这种"上下文学习"能力在多数情况下达到理论最优水平,大大降低了复杂数据分析的技术门槛,为生物学、心理学等各领域的科学研究提供了强大而易用的新工具。
至顶网
科技行者 2025-06-12 13:04:38
新常态下快消企业如何把握增长密码--2022年B2B企业新增长趋势之快消品牌商篇
自18世纪以来,人类历史已经历了三次较大的科技及产业革命。
至顶网
业界供稿 2022-03-15 17:34:14
为创意写作量身定制:Midjourney团队如何让AI写作变得更有趣更多样化
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
至顶网
科技行者 2025-07-30 10:01:42
复旦大学团队革命性突破:用代码教AI推理,让机器学会"举一反三"的思考艺术
这项由复旦大学等机构合作完成的研究提出了CodeI/O方法,通过让AI学习预测代码的输入输出来提升通用推理能力。该方法将45万个代码文件转化为350万个训练样本,让AI用自然语言推理代码逻辑,从而掌握逻辑规划、状态搜索等推理技能。实验显示,在14个评测基准上,CodeI/O训练的模型在符号、科学、逻辑、数学等推理任务上都实现了均衡显著的性能提升。
至顶网
科技行者 2025-10-11 09:56:35
VolSplat:浙江大学团队重新定义3D场景重建,像搭积木一样精准还原虚拟世界
浙江大学等高校研究团队开发的VolSplat系统,通过"体素对齐"替代传统"像素对齐"方法,实现了快速高质量的3D场景重建。该技术仅需6张普通照片即可生成精确3D模型,在RealEstate10K等标准数据集上显著超越现有方法,为机器人导航、增强现实、建筑设计等领域提供了新的技术选择,代表了3D重建领域从二维思维向三维思维的重要转变。
至顶网
科技行者 2025-10-14 10:05:12
让AI看懂视频因果关系:女王大学突破视频推理技术壁垒
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。
至顶网
科技行者 2025-07-09 15:45:45
硬科技智能“四重奏”
——“第12届中国硬科技产业链创新趋势峰会”
至顶网
毛烁 2024-10-28 18:27:17
华中科技大学团队破解AI绘画难题:让图像生成模型既快又好的秘密武器
华中科技大学团队破解了AI绘画系统中长期存在的优化困境:高质量图像重建与高效图像生成之间的矛盾。他们提出的VA-VAE技术通过视觉基础模型对齐,让图像压缩器在保持高精度的同时为生成器提供更易学习的环境。结合LightningDiT优化框架,该系统实现了21倍训练加速,在ImageNet数据集上创造了FID=1.35的最佳记录,为AI图像生成领域带来了突破性进展。
至顶网
科技行者 2025-09-16 10:31:25
小模型也能当金融顾问?新数据训练法让8B模型媲美32B巨头
Perfios公司研究团队开发了创新的AI理财顾问训练框架,通过行为心理学驱动的数据生成方法,让8B参数的小模型在个人理财建议方面达到了与32B大模型相当的性能,同时运营成本降低80%。该方法首次将用户心理状态分析作为独立训练阶段,显著提升了AI建议的个性化程度和人性化表达,为普及化AI理财服务提供了技术路径。
至顶网
科技行者 2025-09-30 10:51:12
《数字经济洞察周报》2023年第22期 |第十四届夏季达沃斯论坛在天津召开
2023年新领军者年会在天津召开
至顶网
孙硕,吕敬儒 2023-06-30 17:11:13
360 AI负责人梁志辉:AI搜索不是"缝合怪",2025是从游击队转向正规军的关键一年
AI刚出现的头两三年,大家都觉得AI会颠覆一切,可能需要用一些全新的标准来评价AI产品。但是经过一年多的发展,大家发现AI产品本质上还是产品,依然要用传统的产品指标来衡量,比如点击率、转化率、留存率等这些硬核指标。如果用户不喜欢你的产品,点击率自然就上不去;如果产品没有足够的黏性,日活跃用户(DAU)也就积累不起来。
至顶网
Super黄的念想 2025-01-14 11:04:06
<
上一页
328
329
330
331
332
333
334
335
336
337
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号