搜一下
用了 0.117975秒,为您找到
大发
玩和值
稳定
中方
法规
罔芷
88pkee
驻测
相关内容7980 条
谷歌旗下DeepMind团队发现语言模型"内功心法":用相关性挖掘引导AI思路的全新技法
这项研究提出了CorrSteer方法,通过分析大语言模型神经激活与任务表现的相关性来选择和强化关键特征,实现精准的AI行为调节。该方法只需4000个样本即可显著提升模型在安全性、偏见缓解和知识问答等任务上的表现,同时保持较低的副作用率,为AI系统的实际部署提供了高效且成本友好的优化方案。
至顶网
科技行者 2025-08-28 11:07:37
北京大学团队突破性进展:让AI从看懂动作变成创造表演者
北京大学团队开发的ReMoMask系统实现了文本到3D人体动作生成的重大突破,通过双向动量学习、语义时空注意力和检索增强指导三项核心创新,在权威数据集上取得显著性能提升,为电影制作、游戏开发、虚拟现实等领域提供了高质量的动作生成解决方案,标志着人工智能向更自然人机交互迈进的重要进展。
至顶网
科技行者 2025-08-07 14:19:08
斯坦福大学突破性视频生成技术:让AI记住更多画面还不"跑偏"的FramePack方法
斯坦福大学研究团队提出FramePack技术,通过几何级数压缩和反向采样策略,有效解决了AI视频生成中的遗忘-漂移矛盾问题。该方法实现了固定计算复杂度下的任意长度视频生成,在多项评估指标上表现优异,为AI视频生成领域带来重要突破。
至顶网
科技行者 2025-07-15 11:34:20
腾讯推出UloRL算法:让AI像人类专家一样深度思考,推理能力大幅提升
腾讯混元团队开发了UloRL算法,通过分段生成和动态遮蔽策略解决AI超长推理训练中的效率和质量问题。该方法让30B参数模型在数学推理任务上超越了更大的235B模型,准确率提升超14%,同时训练速度提升2倍。这项技术为AI深度推理能力发展提供了新路径。
至顶网
科技行者 2025-08-05 10:35:15
波士顿大学揭秘:只听声音就能"看见"说话者,AI如何读懂声音里的视觉密码
波士顿大学研究团队开发出Audio2Face人工智能系统,能够仅通过音频信号生成对应的面部动画。该技术通过深度学习分析声音中的细微特征,准确率达87.3%,可应用于视频通话、影视制作、教育康复等领域。研究揭示了声音与视觉之间的深层联系,为跨模态人工智能开辟新方向,但也带来隐私保护和技术滥用等挑战。
至顶网
科技行者 2025-08-29 12:03:48
阿里团队突破多角色动画难题:FantasyPortrait让静态照片开口说话更自然
阿里团队开发的FantasyPortrait系统突破了传统人像动画的局限,通过隐式表情表示和掩码交叉注意力机制,实现了高质量的单人和多人肖像动画生成,特别在跨身份表情迁移方面表现出色,为视频制作和虚拟交流等领域带来新的技术可能性。
至顶网
业界供稿 2025-07-22 16:01:53
从读图到懂图,AI+金融理解力新升级
OCR要落伍了?多模态大模型凭借端到端的图像识别与语义理解能力,正在颠覆传统 OCR 的应用逻辑,预示着图像识别与理解正迈向新一代的技术范式。
至顶网
王聪彬 2025-09-12 15:49:08
字节跳动全新RewardDance框架:让AI在"奖励舞蹈"中精进视觉创作能力
字节跳动团队提出RewardDance框架,首次系统性解决视觉生成中的奖励模型扩展问题。该框架通过将奖励预测转为生成式任务,并将模型规模扩展至260亿参数,同时集成任务指令、参考样例和推理能力,有效解决了"奖励作弊"问题。实验显示,在文本生成图像任务中质量提升10.7分,视频生成性能改善49%,达到行业领先水平,为AI视觉创作提供了更强大可靠的技术基础。
至顶网
科技行者 2025-09-23 13:40:03
康卡斯特和UCL联手:让语音识别模型学会"脑补",仅凭文字就能适应新领域
康卡斯特和UCL研究团队开发了WhisTLE技术,解决语音识别模型在新领域适应中只能依赖昂贵语音数据的问题。该方法通过训练变分自编码器模拟语音编码器输出,实现仅用文本进行深度监督适应。实验显示平均降低12.3%词错误率,且推理时无额外计算成本,为跨域语音识别提供了高效实用的解决方案。
至顶网
科技行者 2025-10-09 12:20:45
科学家用AI破解蛋白质"变形记":从一维密码到三维杰作的终极翻译器
这项由Google DeepMind团队完成的研究开发了AlphaFold系统,能够从氨基酸序列准确预测蛋白质三维结构。在CASP14竞赛中,系统达到92.4分的惊人准确度,远超传统方法。该技术正在革命性地改变药物研发、基础生物学研究等领域,为科学家提供了快速获取蛋白质结构信息的强大工具,标志着计算生物学的重大突破。
至顶网
科技行者 2025-09-22 10:24:38
科学家如何"复活"古老植被:利用古DNA还原过去环境的研究突破
说到底,这项由爱丁堡大学埃洛伊丝·克雷文博士领导的研究为我们打开了一扇通往过去的神奇之门。通过从北极永久冻土中提取和分析古老的DNA片段,研究团队成功重建了北极地区几千年来的植被变化历史,揭示了植物群落对气候变化的复杂响应模式。
至顶网
科技行者 2025-07-07 17:31:27
上海交大团队发布"画图变3D场景"神器:一张照片瞬间生成完整的三维世界
上海交通大学团队开发的SceneGen系统能够从单张照片自动生成完整3D场景,包含准确的几何结构、逼真纹理和正确的空间关系。该技术在两分钟内完成场景重建,几何精度比现有方法提升76%,为游戏开发、室内设计、虚拟现实等领域提供了革命性的内容创建工具,代码已开源供研究使用。
至顶网
科技行者 2025-08-28 14:52:56
技术界的新突破:以色列理工学院研究团队让AI模型学会"思维延续"的神奇技能
以色列理工学院研究团队开发出一种新颖的AI推理改进方法,通过训练专用的"继续思考"标记,让AI模型在解题时能够进行更深入的思考。该方法只需训练单个标记的嵌入向量,保持模型其他参数不变,在数学推理任务中展现出显著效果,准确率提升幅度达到传统方法的三倍以上,为AI推理能力提升提供了高效且通用的解决方案。
至顶网
科技行者 2025-06-19 12:54:40
AI的视觉盲点:伊利诺伊大学团队揭示多模态推理中的"看不见"问题
伊利诺伊大学研究团队发现AI在多模态推理中存在严重的视觉理解缺陷,67%的错误源于对图像信息的误解。他们开发了PAPO方法,通过图像遮挡技术强迫AI真正使用视觉信息,实现了4.4%的性能提升。这项研究对AI在教育、医疗、自动驾驶等领域的可靠应用具有重要意义。
至顶网
科技行者 2025-07-18 09:37:47
16个数字化转型成功的真实案例
各种企业正在越来越多地推出数字化举措,以扩大或构建旨在提高业务效率或收入增长的数字化功能。随着许多数字化转型成功故事的出现,这一趋势正在增加。
至顶网
cio.com 2018-02-26 18:32:33
复旦大学推出BMMR数据集:让AI跨越知识鸿沟,从数学天才走向通识博士
复旦大学团队发布BMMR数据集,这是首个大规模跨学科多模态推理评估基准,包含11万个涵盖300个学科的大学水平问题。研究发现即使最先进的AI模型在跨学科推理中表现有限,揭示了当前AI发展的重要盲点。该数据集支持中英双语,配备专门的推理过程评估工具,为AI向通用智能发展提供重要支撑。
至顶网
科技行者 2025-07-11 10:15:30
机器人也能预测未来?上海AI实验室打造"会做梦"的机器人大脑
上海AI实验室等机构联合开发的EnerVerse系统,首次让机器人具备了"想象未来"的能力。通过将视频生成技术与机器人控制结合,该系统能够预测操作过程并生成相应动作。核心创新包括块状自回归生成、自由锚点视角和4D数据生成引擎,在LIBERO基准测试中达到最佳水平,并在真实环境中成功完成复杂操作任务。
至顶网
科技行者 2025-09-17 13:28:55
香港科技大学重磅突破:让AI绘画不再"翻车"的神奇技术
香港科技大学联合多所高校发布的AMD技术,通过智能识别AI训练中的"禁区"并动态调整训练策略,解决了AI绘画和视频生成中的质量不
稳定
问题。该技术将图像质量评分提升约2%,视频运动质量提升67%,为AI内容创作的实用化应用奠定了重要基础。
至顶网
科技行者 2026-02-25 15:38:58
一个程序员的转型总结:如何从写代码到管团队
李飞曾经是公司里技术最精湛的程序员,当他晋升成为技术负责人后,他发现许多事情不再像写代码那样简单。
至顶网
尼酱 2022-06-16 16:23:50
智谱GLM-5技术曝光,代码能力已经赶上Claude?
智谱GLM-5技术曝光,代码能力已经赶上Claude?
至顶网
至顶AI实验室 2026-02-24 15:06:39
<
上一页
377
378
379
380
381
382
383
384
385
386
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号