搜一下
用了 0.154855秒,为您找到
奔驰
宝马
游戏
网站
bcbm
網纸
YB233
相关内容6498 条
声音能否分辨真假?约翰·霍普金斯大学突破性研究让AI秒识别合成语音
约翰·霍普金斯大学研究团队开发出突破性的少样本学习方法,用于检测AI合成语音。该方法通过自注意力原型网络,仅需10个样本就能快速适应新的语音伪造技术,在日语深度伪造检测中实现32%错误率相对减少。这项技术为应对日益复杂的声音欺诈提供了高效解决方案,有望应用于金融安全、司法取证等领域。
至顶网
科技行者 2025-08-28 11:10:40
《数字经济洞察周报》2023年第14期 | 国家网信办发布意见稿,进一步规范生成式人工智能发展
本周,国家互联网信息办公室印发《生成式人工智能服务管理办法(征求意见稿)》;2023阿里云峰会召开,发布大语言模型“通义千问”。
至顶网
孙硕,宿硕 2023-04-14 18:53:00
2023年,我还留在互联网大厂
对于多数人来说,大厂或许仍是工作的最优解。但也不得不正视大厂的光环的确在褪去。经历了大厂一波又一波的裁员,留下来的人似乎成为了“幸运儿”,只是“幸运”并不一定,压力却是必然。今日推荐 燃次元( ID :chaintruth ) 一篇文章,那些留在大厂的人们。
至顶网
至顶网码客人生频道 2023-01-09 10:22:42
字节跳动推出Seedance 1.0:让AI视频生成快到飞起的新神器
字节跳动Seed团队推出的Seedance 1.0是一个突破性的AI视频生成模型,能够根据文字描述或静态图片快速生成高质量视频。该系统在权威评测平台上击败了Google Veo 3、OpenAI Sora等竞品,获得双项冠军。其核心创新包括多模态统一架构、空间时间分离设计、强化学习优化和10倍推理加速,能在41.4秒内生成5秒1080p视频,大幅降低了专业视频制作门槛。
至顶网
科技行者 2025-06-17 09:46:47
微软造出AI播音员,单次录制90分钟多人对话!看VIBEVOICE如何重新定义语音合成?
微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。
至顶网
至顶AI实验室 2025-08-29 18:38:02
解剖自然图像的秘密:伯克利与谷歌研究团队如何让计算机理解"什么让一张照片看起来像照片"
这篇研究来自加州大学伯克利分校和谷歌研究院团队,探讨了什么让图像看起来"自然"这一问题。论文提出了一种识别自然图像特征的深度学习方法,通过训练神经网络区分真实照片与人工处理的图像,并能将"不自然"的图像转化为更自然的版本。研究不仅揭示了自然图像在颜色分布、纹理特征和内容语义等方面的规律,还展示了在图像修复、质量提升和伪造检测等领域的潜在应用,为理解人类视觉感知和改进AI图像生成提供了新视角。
至顶网
科技行者 2025-07-07 17:32:15
Meta团队如何让AI学会全世界的语言?重新定义多语言视觉理解的全球化突破
Meta AI团队联合MIT等机构开发的MetaCLIP 2系统,首次实现了真正的全球化AI视觉理解。该系统支持300多种语言,不仅突破了传统多语言AI的"诅咒"问题,还让英语性能提升0.8%,在多项国际测试中创下新纪录。通过创新的训练策略和开源架构,为构建真正服务全人类的AI技术奠定了基础。
至顶网
科技行者 2025-08-06 11:08:48
解锁区块链智能
区块链如何为人工智能解锁新的领域?
至顶网
科技行者 2018-06-15 11:28:04
字节跳动推出Seedance 1.0,让AI生成视频快到起飞的新神器
字节跳动Seed团队推出的Seedance 1.0是一个突破性的AI视频生成模型,能够根据文字描述或静态图片快速生成高质量视频。
至顶网
至顶AI实验室 2025-06-17 16:11:09
MiniMax推出革命性"零门槛"语音克隆技术:仅需一段录音就能让任何声音说出32种语言
MiniMax公司开发的MiniMax-Speech语音合成系统实现了真正的"零门槛"声音克隆技术,仅需一段录音即可生成32种语言的高质量语音。该系统采用创新的学习型声音编码器和Flow-VAE技术,在全球TTS竞技场中击败OpenAI等巨头登顶第一。
至顶网
科技行者 2025-07-09 11:54:49
AI也能"看懂"3D空间!香港科技大学团队让聊天机器人学会房间布局,颠覆传统3D建模方式
SPATIALLM是一个突破性的AI系统,能够理解3D室内空间并生成结构化场景描述。由香港科技大学和Manycore Tech公司研究团队开发,该系统基于大语言模型架构,可直接处理点云数据并输出Python代码形式的空间描述。研究团队构建了包含12328个场景的大规模数据集,在布局估计和3D物体检测任务上取得了领先性能,并展现出强大的跨域泛化能力,为增强现实、机器人导航和室内设计等应用开辟新可能。
至顶网
科技行者 2025-06-12 13:05:35
有想象的地方,就有视频云
2021,阿里云视频云全景创新峰会,努力尝试站在近景和远景之处,全景观察这个时代的超视频化课题。
至顶网
业界供稿 2021-07-15 17:20:50
俄罗斯研究团队推出光流估计新方法:让超高清视频分析更省内存、更精准
俄罗斯莫斯科国立大学研究团队开发出MEMFOF光流估计新方法,在保持顶尖精度的同时将1080p视频分析的GPU内存消耗从8GB降至2GB,实现约4倍内存节省。该方法通过三帧策略、相关性体积优化和高分辨率训练在多个国际基准测试中取得第一名成绩,为高清视频分析技术的普及奠定基础。
至顶网
科技行者 2025-07-03 10:01:43
HTC VIVE发布多款高品质虚拟现实产品,以“软硬双擎”驱动VR新纪元
HTC正式推出全能VR一体机VIVE FOCUS 3和革新专业级PC-VR VIVE PRO 2,发布VIVE BUSINESS商用平台,为商用和消费者VR设定了新的基准。
至顶网
业界供稿 2021-05-12 10:20:43
MIT和Jina AI团队联手打造:小身材大能量的代码搜索新利器
MIT和Jina AI联合开发的jina-code-embeddings代码嵌入模型,通过改造预训练代码生成模型实现高效代码检索。该模型支持自然语言查询代码、技术问答和跨语言代码搜索,尽管参数规模较小(0.5B-1.5B),但在25项基准测试中表现优异,为AI辅助编程和智能开发环境提供了高性价比的基础工具。
至顶网
科技行者 2025-09-05 11:26:15
AI能否准确理解英国公共卫生指南?英国卫生安全局首创最大规模LLM健康知识基准测试
英国卫生安全局研究团队首次构建了包含8000多道题目的AI公共卫生知识评测基准PubHealthBench,测试24个AI模型对英国健康指南的掌握程度。结果显示最先进AI在选择题中正确率超90%,但自由作答时降至75%以下,且在面向公众的指南上表现优于专业医疗指南。
至顶网
科技行者 2025-07-08 09:32:03
ByteDance种子实验室重磅推出VeOmni:让AI训练像搭积木一样简单的全新框架
ByteDance种子实验室推出VeOmni全模态AI训练框架,通过模块化设计和分布式优化策略,解决了同时训练处理文字、图像、视频、音频等多种数据类型AI模型的技术难题。该框架让300亿参数模型在128个GPU上实现每秒2800+ tokens处理速度,支持16万长度序列,在与主流框架对比中展现显著性能优势。
至顶网
科技行者 2025-08-07 14:14:57
震撼登场!AI不再需要"家教",自信心竟成了最佳老师——莫斯科团队突破性发现
莫斯科研究团队开发了基于自信心的AI训练新方法RLSC,让AI模型通过分析自己回答的可信度来自我改进,无需外部标注数据。该方法仅用16个样本和20个训练步骤,就让数学AI模型在多项测试中准确率提升13-22个百分点,同时大幅降低了计算成本,为AI训练提供了高效实用的新思路。
至顶网
科技行者 2025-06-17 09:47:52
突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"
西湖大学研究团队发表突破性论文,提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上,同时保持90%以上的准确率,有望解决当前AI系统"记忆不够用"的核心问题,为智能手机、医疗影像、自动驾驶等领域带来重大突破。
至顶网
科技行者 2025-08-04 13:34:06
万字梳理中国AIGC产业峰会激辩,大模型应用最全行业参考在此
在中国AIGC产业峰会的现场,20位大咖展开激辩。从软件应用、智能终端乃至具身智能等,AIGC正在全面席卷,「你好,新应用!」成为本届AIGC峰会主题。
至顶网
业界供稿 2024-04-19 16:56:56
<
上一页
313
314
315
316
317
318
319
320
321
322
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号