搜一下
用了 0.057982秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容1228 条
AI训练也要"刹车":BluOrion公司如何让大模型告别暴走
BluOrion公司开发的ZClip是一种智能梯度裁剪算法,解决了大型语言模型训练中的梯度爆炸和损失飙升问题。通过Z分数统计检测和动态调整策略,ZClip能够自适应地控制梯度幅度,相比传统固定阈值方法提升训练效率35%以上,同时显著降低训练失败风险,为大模型训练提供了更稳定、高效的解决方案。
至顶网
科技行者 2025-07-16 23:13:11
阿里通义团队让AI学会"读心术"——HumanOmniV2如何让机器真正懂人心
阿里巴巴通义实验室的研究团队开发了HumanOmniV2,这是一个能够真正"读懂"人类复杂意图和情感的AI系统。该系统通过改进强化学习方法,让AI在回答问题前必须先全面理解多模态背景信息,解决了现有AI模型忽略重要线索和缺乏全局理解的问题,在多项测试中表现优异。
至顶网
科技行者 2025-07-03 13:59:35
约翰内斯开普勒大学突破:让计算机像人脑一样处理多维信息的神奇技术
这项由奥地利约翰内斯开普勒大学团队开发的pLSTM技术,创新性地解决了人工智能在处理多维数据时的核心难题。通过引入源门、转换门和标记门三种机制,实现了真正的多维并行信息处理。在箭头指向外推任务中展现出优异的泛化能力,在图像识别和分子图谱分析等实际应用中也显示出强大潜力,为构建更智能的多维信息处理系统开辟了新路径。
至顶网
科技行者 2025-06-19 12:53:35
北京大学团队首次全面评估GPT-4o图像生成能力:AI绘画竞赛中的新冠军诞生
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。
至顶网
科技行者 2025-07-15 11:38:08
卡内基梅隆大学新突破:让AI学会"看懂"天空中的汽车,再也不用担心航拍车辆识别困难了
卡内基梅隆大学研究团队开发了一种创新的航拍图像车辆检测技术,通过生成式AI和跨域适应解决了不同地区环境差异导致的检测性能下降问题。该方法利用扩散模型生成合成训练数据,结合多通道注意力机制实现精确标注,在多个数据集上相较现有方法提升显著,为智能交通、城市规划、应急响应等领域提供了实用的技术解决方案,并贡献了两个高质量的航拍车辆检测数据集。
至顶网
科技行者 2025-08-06 11:07:32
他在狱中看了本黑客的书,刑满从零起步学编程,以后想靠区块链翻身
「 阿达的微信名是一串数字,那是他在佛山监狱服刑的囚号。从一名服刑人员转型硬件工程师,编程重启了阿达的人生。科技并不冰冷,它描摹未来蓝图,更关照当下烟火。」
至顶网
尼酱 2023-01-04 11:00:36
UNC研究团队推出Bifrost-1:用"补丁级CLIP"让AI既能看又能画,训练成本骤降90%!
北卡大学研究团队推出Bifrost-1系统,通过创新的"补丁级CLIP潜在变量"技术,成功让多模态大语言模型和扩散模型高效协作,实现了既能理解又能创作图像的AI助手。该方法避免了传统技术的高成本训练问题,在保持原有理解能力的同时,以90%的成本降幅实现了与顶级方法相当的图像生成质量,为多模态AI发展提供了全新的"桥接"思路。
至顶网
科技行者 2025-08-14 12:44:32
AI界的"免费午餐":法国瓦雷奥团队如何用公开数据打败科技巨头的视觉AI模型
这项突破性研究由法国瓦雷奥公司联合荷兰高校团队完成,开发出名为Franca的开源AI视觉模型。该模型仅使用公开数据训练,却在图像分类、物体检测、语义分割等多项任务中达到或超越了谷歌、Meta等科技巨头的私有模型性能。研究团队创新性地引入"套娃式"多层记忆系统和空间偏见消除技术,并完全开源了模型、代码和训练数据,为AI技术民主化做出重要贡献。
至顶网
科技行者 2025-07-24 16:25:21
放开那个艺术家!Glaze保护艺术免受AI窥探
生成式AI对艺术风格的疯狂模仿,应当休矣。
至顶网
TechCrunch 2023-03-24 16:13:19
香港科技大学重磅发布Audio-FLAN:全球首个音频版"GPT",让AI既能听又能创造
香港科技大学研究团队发布了Audio-FLAN,这是全球首个大规模音频指令训练数据集。该数据集涵盖语音、音乐、声音三大领域的80个任务,包含超过1亿个训练样本,首次实现了音频领域的统一指令学习。通过类似ChatGPT的训练方法,Audio-FLAN能够训练出既能理解又能生成音频的通用AI模型,有望推动音频人工智能从专业化工具向通用助手的转变。
至顶网
科技行者 2025-08-20 18:06:21
从童画到动画:让孩子涂鸦"活"起来的神奇技术——大湾区大学突破性研究成果
大湾区大学研究团队开发的FairyGen系统能够将儿童简笔画转换为完整动画故事。该系统通过智能故事规划、风格传播适配器和3D重建技术,让画中角色"活"起来并保持原画艺术风格。采用两阶段训练策略分离身份与运动学习,实现自然流畅的动画效果,为创意教育和个性化内容创作开辟新途径。
至顶网
科技行者 2025-07-01 14:11:55
摩根士丹利开放源码:Q语言编程新突破,让AI掌握金融界专用代码语言
摩根士丹利研究团队开发了专门掌握Q编程语言的AI模型QQwen,通过创新的三阶段训练方法(预训练、监督学习、强化学习),让开源AI模型在Q语言编程测试中达到59%准确率,超越GPT-4.1等商业模型。研究团队完全开源了模型、数据和训练代码,为AI专业化训练提供了可复制的成功范式,证明了中等规模开源模型通过针对性训练可以在特定领域超越大型商业模型的表现。
至顶网
科技行者 2025-08-15 09:06:51
AI助手变身智能文档管家:伊利诺伊大学DynamicRAG突破传统问答局限
伊利诺伊大学研究团队提出DynamicRAG框架,通过动态重排序器和强化学习技术,让AI系统能根据问题复杂度智能调整参考文档数量和排序。该系统在七个知识密集型数据集上表现优异,显著提升了问答准确性和效率,为构建更智能的AI助手指明了新方向。
至顶网
科技行者 2025-07-09 09:42:43
UC默塞德等高校联合推出Sa2VA:让AI同时看懂图像和视频的智能助手
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。
至顶网
科技行者 2025-09-16 11:09:55
斯坦福大学、Meta和密歇根大学联合揭晓:流媒体视频里的AI助手能边看边聊,还会主动出招帮你完成任务
这项由斯坦福大学、Meta公司和密歇根大学联合完成的研究,开发了能够实时观看视频并主动提供任务指导的AI助手系统。研究团队创建了包含30万对话的PROASSIST数据集,设计了创新的评估方法,并开发了能处理流媒体视频的端到端模型。实验显示,该系统能够在烹饪、组装等多种任务中提供及时准确的指导,为开发真正智能的人工助手奠定了基础。
至顶网
科技行者 2025-06-13 08:02:35
Google DeepMind揭开AI搜索的致命缺陷:为什么最强大的搜索引擎也无法找到你想要的一切
Google DeepMind研究团队通过理论分析和实验验证,发现了AI搜索系统的数学局限:基于固定维度向量的搜索无法表示所有文档组合关系。他们创建的LIMIT测试集让顶尖AI模型准确率低于20%,证明问题源于数学本质而非工程缺陷。
至顶网
科技行者 2025-09-22 10:27:55
医生眼中的AI助手:让CT扫描诊断更精准的"两步走"智能系统
来自印度维洛尔理工学院的研究团队开发了UGPL系统,这是一种模仿医生诊断思路的AI技术,能够智能分析CT扫描图像。系统采用"先看森林再看树"的策略,首先进行全局分析识别可疑区域,然后重点检查这些区域。在肾脏疾病、肺癌和COVID-19三项诊断任务上,准确率分别提升了3.29%、2.46%和8.08%,为医疗AI发展指出了新方向。
至顶网
科技行者 2025-07-25 11:46:39
PLADIS:三星研究院用稀疏注意力机制让AI画图更懂你说的话
三星研究院提出PLADIS技术,通过稀疏注意力机制显著提升AI绘画的文字理解准确性。该方法无需重训练模型,仅在推理阶段替换注意力计算函数,就能让AI更精准理解用户描述,生成更符合要求的图像。实验显示图像质量提升20%,文字匹配度大幅改善,且兼容各种现有AI绘画系统。
至顶网
科技行者 2025-08-04 09:58:23
NAVER AI Lab团队突破性解决3D图像合成难题:让AI同时"看"和"画"出完整的三维世界
这是一项由NAVER AI Lab、韩国科学技术院和首尔大学联合完成的突破性研究,提出了通过跨模态注意力注入技术同时生成新视角图像和对齐几何结构的方法。该技术基于扭曲与修补思路,使用双并行扩散网络处理图像和几何,通过创新的注意力共享机制确保两种模态完美对齐,克服了传统方法需要大量标定图像或无法外推的局限性,在多个数据集上验证了其在外推场景下的卓越性能,为VR/AR、游戏开发等领域开辟了新的应用可能。
至顶网
科技行者 2025-06-19 10:47:01
斯坦福大学和字节跳动联手打造:让AI生成超长视频不再是梦想
斯坦福大学和字节跳动联合研究团队开发出混合上下文(MoC)技术,革命性地解决了AI长视频生成中的记忆与计算难题。该技术将视频生成重新定义为信息检索问题,通过智能选择最相关历史信息,实现了85%稀疏化率,计算效率提升7倍,生成速度提升2.2倍,能稳定生成分钟级高质量连贯视频,为视频创作民主化开辟新路径。
至顶网
科技行者 2025-09-04 09:59:17
<
上一页
50
51
52
53
54
55
56
57
58
59
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号