用了 0.048481秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容3164 条
  • 游戏世界也能"人工制造"?Skywork AI让你用键盘鼠标随心创造虚拟世界

    Skywork AI推出Matrix-Game,这是首个能根据键盘鼠标操作实时生成交互式游戏世界的AI模型。该系统使用2700小时《我的世界》视频训练,拥有170亿参数,能精确响应用户指令生成符合物理规律的游戏场景。研究团队还开发了GameWorld Score评测标准,验证了Matrix-Game在控制精度和视觉质量方面显著超越现有模型,为AI辅助游戏开发和虚拟世界创建开辟了新方向。
    至顶网  科技行者  2025-06-30 10:21:50  
  • NVIDIA Eagle 2.5:让AI"看得更久、看得更细"的视觉语言模型

    你是否曾想过,如果AI能像人类一样看完整部电影,或者理解超高清图像中的细微细节会怎样?普通的AI模型在这方面往往力不从心,它们就像只能看几秒视频或者只能看低分辨率图片的"近视眼"。NVIDIA联合多所高校的研究团队近日推出的Eagle 2.5就是为了解决这一问题,让AI拥有"看得更久、看得更清"的能力。
    至顶网  科技行者  2025-04-23 17:59:54  
  • 小公司如何训练出超越巨头的AI网络助手?香港科技大学团队的"探索进化"新方案

    香港科技大学团队提出WebExplorer框架,通过"模型驱动探索"和"迭代查询演化"两阶段生成高质量训练数据,成功训练出80亿参数的WebExplorer-8B模型。该模型在多个信息搜索基准测试中超越了720亿参数的大型模型,支持长达100轮的工具调用和128K上下文长度,展现了开源AI在网络助手领域的突破潜力。
    至顶网  科技行者  2025-09-24 13:55:36  
  • CIO专访:富卫集团的数字化战略推进之路

    富卫集团(FWD)首席数字技术与运营官,分享了这家泛亚保险巨头如何推动变革并将技术置于服务的核心位置。
    至顶网  CIO  2024-07-01 16:25:34  
  • 微软研究院突破:能看能编程的AI"达芬奇",让机器同时拥有眼睛和程序员的大脑

    微软研究院开发的VisCodex实现了多模态AI的重要突破,通过创新的模型融合技术让AI同时具备视觉理解和编程能力。该系统采用任务向量融合方法,将视觉语言模型与编程模型巧妙结合,并构建了包含59.8万样本的多模态编程数据集。测试显示其性能已接近GPT-4o水平,为未来的智能编程辅助和低代码开发提供了新的可能性。
    至顶网  科技行者  2025-08-18 13:56:13  
  • 微软Azure Quantum:加速量子时代的探索步伐

    微软及其Azure Quantum项目的合作方们一直在量子计算研究项目中开辟新的天地。最近,他们即将成功把逻辑量子比特的数量增加至四倍,而这只是今年开展的一系列重要量子研究项目中的最新成果。
    至顶网  至顶网软件与服务频道  2024-10-04 09:01:08  
  • 视频编辑新突破:西湖大学团队推出无需训练的FlowDirector精准文本引导视频编辑技术

    这项研究介绍了FlowDirector,一种无需训练的视频编辑新框架,由西湖大学AGI实验室开发。不同于传统方法,该技术避开了易导致时间不一致和结构失真的反转过程,而是直接在数据空间中进行编辑。通过常微分方程引导视频沿着时空流形平滑过渡,结合空间注意力流校正和差分平均引导机制,实现了精确的文本引导视频编辑,同时保持未编辑区域的完整性和时间连贯性,为视频内容创作提供了新可能。
    至顶网  科技行者  2025-06-10 08:15:13  
  • 对比扩散与自回归语言模型:从文本嵌入角度的深度分析

    这项研究比较了扩散与自回归语言模型在文本嵌入领域的表现差异。研究团队提出,自回归语言模型由于单向注意力机制而难以捕捉全局语境,而扩散语言模型的双向注意力架构天然更适合文本嵌入任务。他们开发的DIFFEMBED模型在长文档检索、推理密集型检索和指令遵循检索等任务上显著优于传统LLM嵌入模型,在长文档检索提升20%,推理密集型检索提升8%。研究还创建了REASONAUG数据集,包含近11,000对逻辑相关样本。实验证明双向注意力是处理长文本和复杂内容的关键因素。
    至顶网  科技行者  2025-05-27 14:38:58  
  • 用音频"修复"残缺音乐:斯坦福团队让AI学会"脑补"音乐空白

    这项来自斯坦福大学等机构的研究首次将离散扩散模型应用于音频修复领域,通过将音频转换为词汇序列,实现了对长达500毫秒音频空白的有效修复。该方法显著优于传统技术,在处理音频中断、损坏录音恢复等场景中展现出广阔应用前景,为音频处理技术开辟了新的发展道路。
    至顶网  科技行者  2025-07-22 13:22:38  
  • 纽约大学团队重新定义机器人学习:用"接触点"替代语言指令,让机器人更懂物理世界

    纽约大学等多家机构联合研究提出了接触锚定策略,用物理接触点替代语言指令来训练机器人。该方法仅用23小时演示数据就实现了抓取、开启和关闭三种基本操作,在零样本评估中比现有方法性能高出56%。研究团队还开发了轻量级仿真环境EgoGym加速模型迭代,并在多个机器人平台上验证了跨平台兼容性。这项工作为资源受限环境下的机器人学习提供了高效解决方案。
    至顶网  科技行者  2026-02-12 13:27:39  
  • 突破复杂指令编辑难题:加州大学伯克利分校团队推出X-Planner,让AI图像编辑像聊天一样简单

    这项由加州大学伯克利分校、香港大学和Adobe联合开展的研究,开发了名为X-Planner的AI图像编辑规划系统,解决了现有AI工具难以理解复杂编辑指令的问题。该系统能将"让图片看起来像夏天"等自然语言指令智能分解为具体编辑步骤,并自动生成精确的控制信息,显著提升了AI图像编辑的准确性和可控性。
    至顶网  科技行者  2025-07-11 09:53:25  
  • 大模型推理成本降低40%:StepFun的Step-3如何用321亿参数重新定义AI效率

    StepFun公司发布的Step-3模型通过创新的模型-系统协同设计,实现了321亿参数规模下的超高效率运行。该研究采用注意力-前馈网络分离架构和多矩阵分解注意力机制,在保持强大性能的同时,将解码成本降低约40%,达到每GPU每秒4039个词汇单元的处理速度,为大型AI模型的经济化部署开辟了新路径。
    至顶网  科技行者  2025-08-06 12:50:17  
  • 一个海外程序员的纠结

    当毕业生的目光都聚焦在国内的那些“金饭碗”、“铁饭碗”时,海外谋生又是怎样一副景象呢?
    至顶网  至顶网码客人生频道  2022-05-30 10:39:37  
  • 数据表单不够用:DATARUBRICS来了!自动化数据集质量评估与问责框架

    这篇研究介绍了DATARUBRICS,一个专为评估机器学习数据集质量而设计的创新框架。研究团队发现现有的数据表单工具缺乏可量化的质量评估标准,因此开发了基于十个关键维度(包括数据来源、标注方法、质量保证等)的结构化评估体系。通过对多个顶级学术会议的数据集论文分析,研究揭示了机器生成数据的增长趋势及各会议在数据质量要求上的差异。DATARUBRICS不仅支持人工评估,还能通过LLM实现自动化评估,为日益增长的数据集审核需求提供了可行解决方案。
    至顶网  科技行者  2025-06-06 17:27:28  
  • 哈佛与浙江大学联手突破:AI绘画新技术让多物体精准放置成为现实

    这项由哈佛医学院和浙江大学联合开发的3DIS-FLUX技术,成功解决了AI绘画中多物体精确控制的难题。通过将复杂任务分解为布局规划和精细渲染两个阶段,并采用创新的注意力控制机制,该技术实现了比现有方法高出41%的成功率。其免训练的设计让技术能够快速适配新模型,为数字创作领域带来了更可控、更高效的AI绘画解决方案。
    至顶网  科技行者  2025-09-16 10:30:03  
  • 蚂蚁集团:让AI助手变得更"听话"的神奇配方——动态目标边距让机器人学会分辨好坏建议

    蚂蚁集团研究团队提出了γ-PO方法,通过动态调节AI训练中的目标边距来提升大语言模型对齐效果。该方法能够自动识别训练数据中答案质量差距的大小,对明显好坏的答案对加大学习强度,对模糊不清的答案对适当降低学习强度,避免AI被不确定信息误导。实验显示该方法在多个基准测试中平均提升4.4%性能,且几乎不增加计算成本,具有良好的即插即用特性。
    至顶网  科技行者  2025-06-12 11:21:56  
  • 北京大学等顶尖高校联手破解AI记忆难题:让大模型学会"压缩记忆"的神奇技术

    这项由北京大学等多家顶尖机构联合完成的研究解决了大语言模型的关键技术难题:如何高效管理AI的"记忆系统"。研究团队开发的KV-CoRE技术能够智能压缩AI记忆,在几乎不影响性能的前提下大幅节省存储空间和提升运行速度,为AI系统的实际部署提供了革命性解决方案。
    至顶网  科技行者  2026-02-11 13:02:29  
  • 智能图像分割迎来新突破:美国大学团队让AI学会像侦探一样"慧眼识物"

    电子科技大学等多所院校联合开发的RPCANet++系统,通过巧妙结合传统数学理论与深度学习技术,实现了既高效又可解释的稀疏物体分割。该系统在红外小目标检测、医学血管分割、工业缺陷检测等多个领域表现优异,为构建可信赖的AI视觉系统提供了新思路。
    至顶网  科技行者  2025-10-11 10:06:00  
  • IndexMark:香港浸会大学团队开创自回归图像生成模型的无训练水印技术

    香港浸会大学周開陽教授率领的研究团队提出了IndexMark,这是首个针对自回归图像生成模型的免训练水印框架。该方法利用码本中索引的冗余性,通过匹配-替换策略在生成过程中嵌入不可见水印。具体而言,IndexMark将码本索引分为红绿两组,在图像生成时有选择地用绿色索引替换红色索引,实现水印嵌入而不影响图像质量。水印验证通过计算图像中绿色索引比例完成,并引入索引编码器提高精度。
    至顶网  科技行者  2025-05-26 17:23:48  
  • 7分钟分析人类全基因组,他们刷新全球纪录,此前最快也要24小时

    7分钟,这是来自中国的一支团队“合力出成绩”、一举打破的世界纪录: 全球首次将人类全基因组分析,推进分钟级时代
    至顶网  业界供稿  2021-12-23 11:29:00  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号