搜一下
用了 0.985351秒,为您找到
宝宝
计划
手机
软件
網纸
YB233
相关内容27718 条
香港科技大学重磅发布Audio-FLAN:全球首个音频版"GPT",让AI既能听又能创造
香港科技大学研究团队发布了Audio-FLAN,这是全球首个大规模音频指令训练数据集。该数据集涵盖语音、音乐、声音三大领域的80个任务,包含超过1亿个训练样本,首次实现了音频领域的统一指令学习。通过类似ChatGPT的训练方法,Audio-FLAN能够训练出既能理解又能生成音频的通用AI模型,有望推动音频人工智能从专业化工具向通用助手的转变。
至顶网
科技行者 2025-08-20 18:06:21
北航大学团队推出Easy Dataset:让普通人也能制作AI训练数据的神奇工具
北航团队推出Easy Dataset框架,通过直观的图形界面和角色驱动的生成方法,让普通用户能够轻松将各种格式文档转换为高质量的AI训练数据。该工具集成了智能文档解析、混合分块策略和个性化问答生成功能,在金融领域实验中显著提升了AI模型的专业表现,同时保持通用能力。项目已开源并获得超过9000颗GitHub星标。
至顶网
科技行者 2025-07-16 10:01:52
上海AI实验室团队破解AI记忆难题:让机器拥有多个"记忆仓库"不再遗忘重要信息
上海AI实验室团队开发出革命性的MoM(记忆混合体)AI架构,通过模仿人脑海马体的神经机制,为AI系统配备多个独立记忆仓库,彻底解决了传统AI模型处理长文本时的"健忘"问题。该技术在保持线性计算效率的同时,性能接近甚至超越传统Transformer模型,为长文档理解、代码分析、智能对话等应用领域带来突破性进展,现已完全开源供全球研究者使用。
至顶网
科技行者 2025-08-20 18:05:53
港中文团队发布WebGen-Bench:让AI从零写网站,但最强模型正确率仅27.8%
港中文团队发布首个AI网站生成能力基准测试WebGen-Bench,评估结果显示即使最强模型准确率仅27.8%,但通过专门训练的WebGen-LM-32B模型达到38.2%,为AI建站技术发展提供重要参考。
至顶网
科技行者 2025-07-08 09:45:12
斯坦福大学和字节跳动联手打造:让AI生成超长视频不再是梦想
斯坦福大学和字节跳动联合研究团队开发出混合上下文(MoC)技术,革命性地解决了AI长视频生成中的记忆与计算难题。该技术将视频生成重新定义为信息检索问题,通过智能选择最相关历史信息,实现了85%稀疏化率,计算效率提升7倍,生成速度提升2.2倍,能稳定生成分钟级高质量连贯视频,为视频创作民主化开辟新路径。
至顶网
科技行者 2025-09-04 09:59:17
没有空间智能,AI一定是不完整的,李飞飞最新访谈:语言在自然世界中并不存在,世界模型将让人类在多元宇宙中生活
李飞飞的World Labs以"空间智能"重新定义AI,专注3D物理世界理解,4个月估值飙至10亿美元,获科技巨头集体押注。她揭示语言无法编码物理世界,而DNA双螺旋等突破性发现都源于三维空间的深度认知。
至顶网
至顶AI实验室 2025-06-09 16:32:40
【报告】大族激光东南亚海外运营中心投资与全球客户迁移
今天讲的出海案例,是大族激光准备在东南亚投资设立海外运营中心:投资上限 1.5 亿美元,周期预计不超过 36 个月。
至顶网
千流出海 2026-02-25 18:25:06
清华大学推出LongBench v2:让AI在长文本理解上接受人类专家的终极挑战
清华大学联合智谱AI推出LongBench v2长文本理解基准,通过97位专家设计的503道高难度题目,测试AI在8千到200万字文档中的深度推理能力。人类专家仅达53.7%正确率,最强AI模型o1-preview达57.7%,首次在此类任务中超越人类,揭示推理时间对长文本理解的关键作用。
至顶网
科技行者 2026-03-06 15:07:41
OpenClaw 创始人:所有的 App,都是很慢的 API
OpenClaw 创始人 Peter Steinberger 在 2 月中旬宣布加入 OpenAI 前后,接受了两场访谈。
至顶网
高飞的电子替身 2026-02-25 14:05:23
TransPixeler:让透明视频生成变成现实,Adobe研究院破解RGBA视频生成难题
TransPixeler是由香港科技大学和Adobe研究院联合开发的AI视频生成技术,专门解决生成带透明效果(RGBA)视频的难题。该技术巧妙扩展现有视频生成模型,让AI能同时生成RGB颜色和Alpha透明度信息,避免了传统"先生成后提取"方法的缺陷。通过精心设计的注意力机制和训练策略,TransPixeler在有限数据下实现了高质量透明视频生成,为电影特效、游戏开发、VR/AR等领域提供了强大工具。
至顶网
科技行者 2025-09-12 19:47:39
港科大团队让AI注意力机制学会"挑重点":动态掩码稀疏注意力让大模型更聪明更高效
港科大团队提出的动态掩码稀疏注意力机制通过内容感知的动态掩码生成和位置感知的稀疏计算,让大语言模型学会智能分配注意力资源。该方法在保持完整信息的同时大幅降低计算复杂度,在长序列处理中实现10倍以上加速,并在多项基准测试中超越现有方法,为高效长文本处理提供了新的解决方案。
至顶网
科技行者 2025-08-07 11:11:38
MiniMax推出革命性"零门槛"语音克隆技术:仅需一段录音就能让任何声音说出32种语言
MiniMax公司开发的MiniMax-Speech语音合成系统实现了真正的"零门槛"声音克隆技术,仅需一段录音即可生成32种语言的高质量语音。该系统采用创新的学习型声音编码器和Flow-VAE技术,在全球TTS竞技场中击败OpenAI等巨头登顶第一。
至顶网
科技行者 2025-07-09 11:54:49
Stability AI团队突破:让AI不仅会"看"还会"动"的神奇技术
Stability AI团队开发的SP4D技术实现了AI视频生成的重大突破,首次让AI能够同时理解物体外观和运动结构。该技术通过双分支神经网络架构和创新的颜色编码方案,生成的视频内容不仅视觉真实,更具备完整的运动学信息,可直接用于专业动画制作,大幅提升了AI生成内容的实用价值和应用前景。
至顶网
科技行者 2025-09-29 10:06:47
物理模拟也能"压缩"?Flatiron研究院探索AI模型如何在虚拟世界中偷懒却不失精度
Flatiron研究院团队探索了在压缩的"潜在空间"中进行物理模拟的新方法,发现即使压缩1000倍,AI模型仍能准确预测复杂物理现象如流体流动和湍流。研究对比了扩散模型和神经求解器两种方法,发现扩散模型不仅更准确,还能处理系统的不确定性。这项技术将物理模拟速度提升数十倍,为天气预报、工程设计等领域带来革命性改进。
至顶网
科技行者 2025-07-11 09:49:32
01.AI发布Yi-Lightning:一个会思考的AI大脑如何击败众多对手登上全球第六
01.AI发布Yi-Lightning模型,在全球权威AI竞技场Chatbot Arena获得第六名,在中文、数学、编程等专业领域表现尤为出色。该模型采用创新的混合专家架构,通过细粒度专家分割和智能负载均衡实现高效运转,配合三阶段训练策略和RAISE四重安全框架,在真实用户场景中展现卓越性能,为AI技术的实用化发展树立新标杆。
至顶网
科技行者 2026-03-05 10:19:00
医生的AI助手:CRISP-SAM2如何让CT扫描精准识别人体器官
杭州电子科技大学研究团队开发出CRISP-SAM2智能医学影像分析系统,能够结合文字描述和CT图像同时进行器官识别。该系统通过跨模态语义交互技术,无需医生手动提示即可精准分割18种人体器官,在七个数据集测试中表现优异,为医学影像诊断提供了新的AI解决方案。
至顶网
科技行者 2025-07-07 12:16:40
约翰霍普金斯大学破解多模态检索瓶颈:任意模态下多向量索引压缩技术重大突破
约翰霍普金斯大学研究团队开发了革命性的多向量索引压缩技术,解决了多模态检索系统存储需求巨大的问题。他们提出的AGC技术能在保持97%以上搜索性能的同时,将存储需求压缩至原来的3%以下。该技术在文本、图像、视频等多种模态下都表现优异,在视频检索任务中甚至超越了原始系统性能。研究发现现有索引中99%的内容从未被使用,证明了压缩技术的现实必要性,为构建实用的大规模多模态搜索系统奠定了基础。
至顶网
科技行者 2026-02-28 14:06:30
Meta研究团队推出MLGym:让AI学会做科学研究的"训练场"
Meta团队开发的MLGym是首个专门训练AI进行科学研究的平台,包含13个跨领域研究任务。测试显示当前顶级AI模型能改进现有方法但尚无法独立创新,距离真正的AI科学家还有距离。该平台为评估和发展AI研究能力提供了重要工具。
至顶网
科技行者 2025-08-26 12:02:17
神奇的思考机器:研究团队让AI学会了像人类一样深度思考
弗吉尼亚大学联合多所顶尖院校研发出能量基础变换器(EBTs),首次让AI具备真正的深度思考能力。与传统AI的快速反应不同,EBTs通过学会"评判"答案质量并持续优化,实现了动态计算分配、不确定性表达和自我验证三大认知能力。实验显示其学习效率比传统方法提高35%,思考能力提升29%,为AI发展开辟了从"记忆检索"向"智慧判断"转变的新路径。
至顶网
科技行者 2025-07-04 17:44:34
微软研究院推出Phi-4:合成数据驱动的14亿参数推理专家,超越巨型模型的精准思维机器
微软研究院发布Phi-4模型,以140亿参数实现了与大型模型相当的推理能力。该模型采用合成数据驱动的训练方法,在数学推理、科学问答和编程能力方面表现出色,甚至在某些基准测试中超越了规模更大的商业模型。研究创新性地使用了关键标记搜索技术和多阶段训练策略,证明了"数据质量胜过数据数量"的重要原则。这项成果为AI技术的民主化和普及化提供了新的可能性,降低了高质量AI服务的使用门槛。
至顶网
科技行者 2026-03-09 13:11:03
<
上一页
1379
1380
1381
1382
1383
1384
1385
1386
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号