搜一下
用了 0.042672秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容3164 条
澳门大学:图像生成也要"精益求精",AI学会自我优化条件信息
澳门大学研究团队针对自回归图像生成中的条件错误累积问题,提出了基于最优传输理论的创新解决方案。研究发现自回归模型具备自我纠错能力,条件错误影响呈指数衰减,但仍存在"条件不一致"问题。团队创新性地运用瓦瑟斯坦梯度流方法优化条件信息,在ImageNet数据集上取得显著性能提升,为AI图像生成质量控制开辟了新方向。
至顶网
科技行者 2026-02-12 13:32:13
慕尼黑大学团队让AI像蜂群一样自己造机器人军团:无需人工指导的全自动智能体生成技术
慕尼黑大学研究团队开发了SwarmAgentic技术,这是首个能够完全自主生成智能体系统的框架,无需人工预设模板。该技术借鉴蜂群智能原理,让AI系统自己决定需要什么角色、如何分工协作。在旅行规划等六项复杂任务测试中,SwarmAgentic表现优异,在旅行规划任务上比现有最佳方法提升261.8%,展现了全自动智能体系统设计的巨大潜力。
至顶网
科技行者 2025-06-24 15:48:32
AWS吹走了私有云天空中最后一片乌云
未来世界的样子还无法预测,但在这个时间,AWS发布了Outposts产品,他终于进入了传统IT厂商相同的维度,从降维打击到同维竞争,后十年的云计算领域一定会更加精彩。
至顶网
业界供稿 2018-12-14 09:43:57
中科院团队构建史上最大多模态AI对齐数据集:让机器真正读懂人类偏好的秘密武器
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。
至顶网
科技行者 2025-08-20 10:25:42
动画角色也能秒变真人演员:同济大学团队让任何角色都能自由表演动作
同济大学研究团队开发的CharacterShot系统实现了突破性进展,仅需一张角色图片和动作序列即可生成高质量4D角色动画。该技术通过双重注意力机制和邻居约束4D高斯点云优化,解决了传统方法中姿态与视角分离建模的难题,将动画制作时间从数月缩短至20-40分钟,为内容创作、游戏开发、教育应用等领域提供了经济便捷的解决方案。
至顶网
科技行者 2025-10-10 09:32:38
突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"
西湖大学研究团队发表突破性论文,提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上,同时保持90%以上的准确率,有望解决当前AI系统"记忆不够用"的核心问题,为智能手机、医疗影像、自动驾驶等领域带来重大突破。
至顶网
科技行者 2025-08-04 13:34:06
Stability AI团队突破:让AI不仅会"看"还会"动"的神奇技术
Stability AI团队开发的SP4D技术实现了AI视频生成的重大突破,首次让AI能够同时理解物体外观和运动结构。该技术通过双分支神经网络架构和创新的颜色编码方案,生成的视频内容不仅视觉真实,更具备完整的运动学信息,可直接用于专业动画制作,大幅提升了AI生成内容的实用价值和应用前景。
至顶网
科技行者 2025-09-29 10:06:47
斯坦福大学研究团队发明"会读心术"的AI:一个提示就能帮大模型了解你的喜好
斯坦福大学研究团队开发出SynthesizeMe方法,能让AI通过观察用户的选择自动学习个人偏好,无需填写复杂资料。该方法通过三步流程分析用户互动,生成个性化画像,在理解用户偏好方面准确率提升4.4%。研究还构建了PersonalRewardBench测试平台,为AI个性化能力评估提供标准。这项技术有望应用于智能客服、教育和内容推荐等领域。
至顶网
科技行者 2025-06-13 09:47:37
蚂蚁集团包容性AI团队重磅发布Ming-Omni:首个媲美GPT-4o的开源全能AI模型
这项由蚂蚁集团包容性AI团队完成的研究发布了Ming-Omni,这是首个媲美GPT-4o的开源多模态AI模型。该模型能够同时处理文字、图像、音频和视频,并具备语音和图像生成能力。采用MoE架构和模态特定路由器,仅需激活2.8B参数就能达到与7B参数模型相当的性能。在多项基准测试中创造新纪录,特别是在语音理解、图像生成和多模态融合方面表现突出。
至顶网
科技行者 2025-06-18 09:23:26
AI能否准确理解英国公共卫生指南?英国卫生安全局首创最大规模LLM健康知识基准测试
英国卫生安全局研究团队首次构建了包含8000多道题目的AI公共卫生知识评测基准PubHealthBench,测试24个AI模型对英国健康指南的掌握程度。结果显示最先进AI在选择题中正确率超90%,但自由作答时降至75%以下,且在面向公众的指南上表现优于专业医疗指南。
至顶网
科技行者 2025-07-08 09:32:03
NVIDIA发布数据秘籍:如何让AI模型变得更聪明,只需调整"饮食搭配"
NVIDIA联合佐治亚理工学院发布CLIMB框架,首次实现AI训练数据配方的全自动优化。该系统能智能分析和分类海量网络数据,通过迭代搜索找出最佳数据混合比例。实验显示,使用CLIMB优化的数据配方训练的1B参数模型性能超越Llama-3.2-1B达2%,在特定领域提升可达5%。研究团队已开源相关数据集。
至顶网
科技行者 2025-07-17 09:23:07
ByteDance团队新突破:让AI学会像人类一样反思错误并自我纠正
复旦大学和字节跳动团队开发的Agent-R框架,通过让AI学习从错误中恢复而非仅模仿完美示例,实现了AI自我反思和纠错能力的突破。该研究在三个交互环境中验证了AI错误恢复能力的显著提升,平均性能提高5.59%,为智能助手向更灵活适应的问题解决者转变奠定了基础。
至顶网
科技行者 2025-09-19 10:04:19
腾讯混元3D 2.0:让想象变为3D现实的神奇"数字魔术师"
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。
至顶网
科技行者 2025-09-16 13:04:57
上海人工智能实验室最新突破:让AI模型拥有"视觉记忆",解决长文本中图片内容被遗忘的难题
上海人工智能实验室提出CoMemo架构,通过双路径处理解决视觉语言模型在长文本中的图像遗忘问题。该方法结合上下文路径和记忆路径,配合RoPE-DHR位置编码,在七项任务中显著提升性能,为多模态AI的长上下文处理提供了新的解决方案。
至顶网
科技行者 2025-06-24 13:50:00
告别搜索垄断:开源AI搜索框架ODS挑战Perplexity,让人人都能拥有智能搜索助手
研究团队推出开源AI搜索框架ODS,在复杂推理任务中准确率达75.3%,超越GPT-4o搜索版近10个百分点。该框架采用双核心架构设计,包含智能搜索工具和推理代理两个组件,能够理解问题、主动搜集信息并进行多步推理。ODS完全开源且支持插件化配置,打破了AI搜索技术垄断,为技术民主化开创新局面。
至顶网
科技行者 2025-07-31 11:26:53
DeepResearchGym:一款免费、透明且可复现的深度研究评估沙盒,让研究者摆脱商业搜索API的束缚
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
至顶网
科技行者 2025-06-01 19:00:03
2025IAI传鉴国际创意节&传鉴品牌峰会在北京举办!
5月21 -22日,2025 IAI传鉴国际创意节于北京盛大启幕。
至顶网
至顶网人工智能频道 2025-05-23 17:12:46
上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵
上下文腐烂:当百万token成为AI模型的阿喀琉斯之踵
至顶网
至顶AI实验室 2025-08-28 16:44:37
你敢要它就有!至强6新品治好选择困难症
单核10MB L3?基频 4GHz?32TB内存?各种数据中心CPU升级需求都能在这里找到解决方案。
至顶网
至顶网计算频道 2025-03-20 16:07:06
你敢要它就有!至强6新品治好选择困难症
单核10MB L3?基频 4GHz?32TB内存?各种数据中心CPU升级需求都能在这里找到解决方案。
至顶网
科技行者 2025-03-20 16:09:22
<
上一页
144
145
146
147
148
149
150
151
152
153
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号