用了 0.062873秒,为您找到彩神 APP 官方 最高 代理 内部 邀请 码罔芷 YB266CN 驻测相关内容5719 条
  • OPPO AI团队首次系统探索:让AI智能体进行推理思考的四大策略

    OPPO AI团队首次系统性探索了如何让AI智能体进行更深入的推理思考。研究提出ATTS框架,包含并行采样、序列修正、验证合并和多样化探索四大策略。实验发现,给智能体更多尝试机会能显著提升性能,但关键在于知道何时反思而非盲目增加思考。多模型协作效果尤其突出,四个AI模型协作成功率达74.55%。这项工作为AI智能体发展指明了从增大模型转向优化推理策略的新方向。
    至顶网  科技行者  2025-06-24 10:13:19  
  • 分段优化:让大语言模型通过段级信用分配更高效地学习推理能力

    这篇研究论文《段级策略优化》提出了一种介于词元级和轨迹级之间的新型强化学习框架SPO,用于提升大语言模型的推理能力。研究者将生成序列划分为连续段落,并在段级粒度上估计优势,实现了更精确的信用分配和更准确的优势估计。SPO框架包含灵活段落划分、基于蒙特卡洛的段落优势估计和段落优势策略优化三个核心组件。研究团队基于此框架设计了SPO-chain和SPO-tree两个特定实例,分别针对短链思维和长链思维场景。
    至顶网  科技行者  2025-06-09 09:41:19  
  • 打破僵硬动作!南洋理工大学团队为人类视频补帧注入3D控制能力

    南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
    至顶网  科技行者  2025-06-07 09:52:35  
  • 亚马逊云科技推出Amazon Q:重塑未来工作方式

    2023 年11月29日,亚马逊云科技在2023 re:Invent全球大会上推出Amazon Q,这是一种新型生成式AI支持的助手,专门用于满足办公场景需要,可以根据客户业务进行定制。
    至顶网  至顶网软件与服务频道  2023-11-29 17:25:02  
  • 当游戏世界变成AI的"想象空间":香港大学团队揭秘交互式生成视频技术如何重塑数字体验

    香港大学团队联合快手科技发布的这项交互式生成视频技术综述,展示了AI如何实时创造虚拟世界的革命性能力。该技术通过五大模块协同工作,让AI能够根据用户操作实时生成独特的游戏场景,在游戏、机器人训练和自动驾驶等领域展现出巨大应用潜力,有望重塑我们的数字体验方式。
    至顶网  科技行者  2025-07-10 15:42:31  
  • 亚马逊云科技推出Amazon Q:重塑未来工作方式

    2023 年11月29日,亚马逊云科技在2023 re:Invent全球大会上推出Amazon Q,这是一种新型生成式AI支持的助手,专门用于满足办公场景需要,可以根据客户业务进行定制。
    至顶网  科技行者  2023-11-29 17:15:11  
  • 《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布

    本周,OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布。
    至顶网  孙硕 宿硕  2023-03-17 19:06:48  
  • ARIA:用意图驱动的奖励聚合训练更聪明的语言智能体

    这篇来自复旦大学和字节跳动的研究介绍了ARIA方法,解决了语言智能体在开放式交互环境中的训练难题。传统强化学习在这类任务中面临巨大挑战,因为行动空间呈指数级增长,导致奖励信号极度稀疏。ARIA创新性地将语言行动从高维标记空间映射到低维意图空间,聚合语义相似行动的奖励,有效降低了训练方差。实验表明,ARIA在多种任务中平均提升9.95%的性能,同时显著提高训练稳定性和效率。
    至顶网  科技行者  2025-06-05 15:18:27  
  • 华为侯金龙:融合数字技术和电力电子技术,迈向数字能源新时代

    2023中国数字能源生态大会在北京开幕,华为数字能源与客户、伙伴、产业组织、媒体等齐聚一堂。
    至顶网  业界供稿  2023-05-11 16:10:28  
  • Menlo Research新突破:4B参数的Jan-nano如何用"搜索能力"击败671B参数巨无霸模型

    Menlo Research推出革命性AI模型Jan-nano,仅用4B参数就在SimpleQA测试中达到83.2%准确率,超越了6710亿参数的DeepSeek模型。该模型采用创新的"搜索优先"策略,通过多阶段RLVR训练系统,让AI学会高效使用工具而非死记硬背知识。研究发现大模型存在"过度思考"问题,反而影响性能。Jan-nano证明了在AI发展中,聪明的策略比单纯的规模扩张更重要,为资源受限的AI应用开发提供了新思路。
    至顶网  科技行者  2025-07-02 11:02:49  
  • 顶层设计与产业创新 第八届中国云计算标准和应用大会盛大召开

    2018年12月12日,由中国电子技术标准化研究院主办、中国开源云联盟、全国信标委云计算标准工作组协办、至顶网承办的第八届中国云计算标准和应用大会在京召开。
    至顶网  李祥敬  2018-12-12 14:09:19  
  • 数据清洗与扩充让开源语音模型更强大:卡内基梅隆大学团队打造的OWSM v4如何超越工业级模型

    卡内基梅隆大学与本田研究所日本分部的研究团队通过数据扩充和清洗技术,打造了新一代开源语音模型OWSM v4。研究者们开发了一套三步数据清洗流程,从原始YODAS数据集中提取出166,000小时高质量语音数据,涵盖75种语言。基于此数据训练的OWSM v4模型系列在多语言语音识别、语言识别和翻译任务上大幅超越先前版本,甚至在多个场景中与工业级模型Whisper和MMS比肩。该研究证明,即使在学术资源有限的条件下,开源模型通过有效的数据清洗也能实现卓越性能。
    至顶网  科技行者  2025-07-07 17:37:47  
  • MatTools:香港大学研究团队打造全新材料科学大模型基准测试工具

    香港大学研究团队开发的MatTools是首个全面评估大语言模型在材料科学工具应用能力的基准测试框架。研究发现通用型大模型(如GPT-4o)显著优于专业材料科学模型;AI生成的文档作为检索源比原始代码或官方文档更有效;简单的自反思系统反而优于复杂的多代理架构。这项研究为AI辅助科学工具的设计提供了全新思路,强调"通才胜于专才"、"AI懂AI"和"简单更好"的原则,有望加速材料科学研究和技术创新。
    至顶网  科技行者  2025-05-21 14:28:51  
  • 香港科技大学发布 CannyEdit:让AI图像编辑从此告别"塑料感",实现真正的无缝融合

    这项研究推出了CannyEdit图像编辑框架,通过选择性边缘控制和双重提示策略,实现了前所未有的自然编辑效果。在用户测试中,普通用户仅有49.2%能识别出其编辑痕迹,远低于其他方法的76-89%识别率。该技术无需专门训练,可处理添加、移除、替换等多种编辑任务,为AI图像编辑的实用化应用奠定了重要基础。
    至顶网  科技行者  2025-08-18 13:58:20  
  • 字节跳动MAGREF:革命性技术让你的照片变身栩栩如生的视频,还能保持多个人物与物体的精准特征

    MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接机制,在通道维度上运作以更好地保留外观特征。实验表明,MAGREF在身份一致性和视觉质量方面优于现有技术,能将单主体训练泛化到复杂多主体场景,为内容创作者提供了强大而便捷的视频生成工具。
    至顶网  科技行者  2025-06-03 15:18:01  
  • 黑鲨5系列正式发布,售价2799元起

    日前,黑鲨5系列游戏手机正式在北京发布,该系列包括黑鲨5、黑鲨5 Pro、黑鲨5 RS三款新品。
    至顶网  业界供稿  2022-03-31 17:37:46  
  • ALLaM-34B阿拉伯语AI大模型实测:沙特AI局如何让机器说出地道阿拉伯话

    这项研究对沙特数据与AI管理局开发的ALLaM-34B阿拉伯语大模型进行了全面的用户界面评测。研究团队使用23个测试提示,每个重复5次,收集115个回答样本,并用三个前沿AI模型作为评委进行多维度打分。结果显示ALLaM-34B在代码转换和创意生成方面表现优秀(均4.92分),现代标准阿拉伯语和知识问答能力强劲,安全防护可靠,但在方言处理上存在不均衡,为阿拉伯语AI发展提供了重要参考。
    至顶网  科技行者  2025-09-08 14:13:37  
  • OpenAI GPT-5突破性安全架构:当AI学会"思考"后如何确保不越界

    GPT-5是OpenAI于2025年8月发布的新一代多模式大模型,兼具高效应答与深度推理能力,并在安全性、准确性和多语言表现上取得显著提升,尤其在医疗、内容安全与防越狱方面展现突破性进步。
    至顶网  至顶AI实验室  2025-08-11 16:44:20  
  • 从5G至6G 高通徐晧解读为何毫米波是必经之路

    9月29日,在2021中国通信学会环球科学家蓝海论坛上,高通公司中国区研发负责人徐晧博士,以《5G到6G技术演进》为主题,讲解了移动通信技术演进的故事。
    至顶网  科技行者  2021-09-30 15:30:55  
  • 南加大团队揭秘:AI如何准确识别全球11种语言的方言差异

    南加州大学团队开发了Voxlect方言识别系统,使用超过200万语音样本训练AI识别11种语言的方言差异。研究发现地理相邻方言更易混淆,多语言模型性能优于单语言模型。该技术可应用于语音识别公平性分析和语音合成质量评估,为构建更包容的AI语音技术奠定基础,代码已开源供研究使用。
    至顶网  科技行者  2025-08-07 14:19:54  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号