用了 0.051045秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容3164 条
  • 香港科技大学团队突破:让AI像真正的设计师一样,一步步"拼积木"创造3D世界

    香港科技大学团队开发了名为CoPart的革命性3D生成技术,它模仿人类设计师的工作方式,将复杂3D物体分解为多个部件分别生成再组装。该技术采用双重编码策略和相互指导机制,确保各部件既精细独立又协调统一。研究团队还构建了包含91000个部件的大规模数据集PartVerse。实验显示CoPart在生成质量上显著优于传统方法,并支持部件编辑、关节物体生成等多种应用,为3D内容创作开辟了新方向。
    至顶网  科技行者  2025-07-21 11:30:41  
  • Adobe Research团队重新定义长视频生成:从5秒到5分钟的技术突破之路

    Adobe Research联合32家顶尖机构发布重磅研究,全面解析长视频生成技术现状与突破路径。研究发现当前AI视频生成存在时长限制(多数仅5-16秒)和质量衰减问题,通过分析六大技术流派和核心架构组件,为实现电影级长视频生成提供了系统性解决方案,预示着从几秒短片向几分钟完整故事视频的技术跃迁即将到来。
    至顶网  科技行者  2025-07-21 10:02:02  
  • 阿里巴巴Qwen团队首次提出P-GenRM:个性化大模型奖励机制的全新突破

    阿里巴巴Qwen团队提出全球首个个性化生成式奖励模型P-GenRM,通过三阶段训练和测试时用户导向扩展机制,实现AI系统对不同用户偏好的精准适应。该技术在标准测试中平均提升2.31%准确性,测试时扩展机制额外提升3%性能,为客服、教育、内容推荐等领域的个性化AI应用开辟新前景。
    至顶网  科技行者  2026-02-14 10:30:30  
  • 多模态专家混合模型的智能助理:约翰霍普金斯大学团队让AI在测试时自动调整专家选择,性能媲美更大模型

    约翰霍普金斯大学团队提出R2-T2方法,通过测试时动态调整专家权重让多模态AI更智能。该技术无需重训练就能让7B小模型性能超越34B大模型,在视觉问答等9个基准测试中取得显著提升。核心思路是让AI在遇到新任务时自动寻找相似成功案例并模仿其专家选择策略。
    至顶网  科技行者  2025-08-22 10:00:07  
  • 创新力Max,英特尔亮出最新产品矩阵

    上周英特尔举办了一场引人注目的“架构日”活动,公布了未来多年的产品技术路线图、技术战略规划以及一系列新技术。
    至顶网  业界供稿  2018-12-26 16:06:47  
  • 上海交大研究团队让AI从过往经验中学习,代码修复准确率突破40%

    上海交大团队开发SWE-Exp系统,让AI能从过往代码修复经验中学习,通过构建"经验银行"存储成功和失败案例,采用双智能体协作模式实现智能修复。在基准测试中达到41.6%成功率,比之前最好方法提升7.2%,开创了从试错探索向经验驱动修复的新范式。
    至顶网  科技行者  2025-08-07 10:21:09  
  • 阿里巴巴推出Ovis2.5:能看图思考的AI聊天机器人有了"火眼金睛"

    阿里巴巴推出的Ovis2.5是一个革命性的多模态AI模型,具备原生分辨率图像处理和深度推理能力。它采用五阶段训练体系,在OpenCompass评测中创造了开源模型新纪录。其突破性的思考模式让AI能够进行类人推理和自我纠错,在数学推理、图表分析、文字识别等方面表现卓越,为教育、医疗、商业等领域提供了强大的AI助手解决方案。
    至顶网  科技行者  2025-08-27 10:02:16  
  • 中国香港中文大学深圳分校:革命性语音压缩技术,让AI说话更自然更高效

    中国香港中文大学深圳分校研究团队开发了TaDiCodec语音编解码技术,实现了极低6.25Hz帧率和0.0875kbps比特率的高效语音压缩。该技术通过文本感知扩散解码器和端到端训练,在保持优异语音质量的同时显著提升压缩效率,在零样本语音合成中达到2.28%英语和1.19%中文词错误率,为AI语音系统提供了革命性的解决方案。
    至顶网  科技行者  2025-09-01 12:42:08  
  • Meta开发会说话的AI虚拟角色:从语音到电影级视频,一句话就能"变出"会对话的人物

    Meta联合滑铁卢大学开发的MoCha系统实现重大突破,仅需语音和文字描述就能生成电影级会说话的虚拟角色视频。该技术突破传统局限,无需参考图片等辅助条件,还能实现多角色对话场景,在唇音同步、表情自然度等方面显著超越现有方法,为内容创作、教育、娱乐等领域带来革命性变化。
    至顶网  科技行者  2025-07-17 09:29:33  
  • 为创意写作量身定制:Midjourney团队如何让AI写作变得更有趣更多样化

    这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
    至顶网  科技行者  2025-07-30 10:01:42  
  • 从电驱到智能座舱全面覆盖,小米汽车五大自研核心技术正式披露

    刷新行业性能天花板,小米“人车家全生态”五大核心技术,小米 SU7新车亮相。
    至顶网  业界供稿  2023-12-28 18:24:42  
  • 谁才是真正的好老师?北科研团队比较不同推理蒸馏源对大语言模型影响

    这篇研究探讨了大语言模型知识蒸馏过程中教师模型选择的重要性。北科a-m-team团队从三个顶级模型(AM-Thinking-v1、Qwen3-235B-A22B和DeepSeek-R1)收集了189万个问题的推理答案,分析发现AM-Thinking-v1生成的数据表现出更多样的令牌长度分布和更低的困惑度。使用这些数据训练的学生模型在AIME2024(84.3分)、AIME2025(72.2分)、MATH500(98.4分)和LiveCodeBench(65.9分)等基准测试中,AM蒸馏模型始终表现最佳,并展现出根据任务难度动态调整输出长度的能力。
    至顶网  科技行者  2025-05-26 08:10:53  
  • 香港科技大学突破性研究:视频预测AI如何像人类一样思考与推理

    香港科技大学研究团队开发了MOSS-ChatV视频AI系统,通过创新的"过程推理奖励"机制解决了现有视频AI推理过程不一致的问题。该系统不仅能准确预测视频中的未来事件,还能提供清晰的推理解释。研究构建了MOSS-Video数据集,采用动态时间规整算法训练模型,在多个视频理解任务上取得显著性能提升,为视频AI的可解释性发展开辟了新方向。
    至顶网  科技行者  2025-10-16 15:12:56  
  • VidText:视频文本理解的全面评估新基准,打造视觉文本与上下文交互的研究新高度

    VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
    至顶网  科技行者  2025-06-03 18:36:09  
  • 电子眼也能追踪3D世界:苏黎世联邦理工学院让多摄像头系统拥有了立体追踪超能力

    苏黎世联邦理工学院研究团队开发出首个多摄像头3D点追踪系统MVTracker,只需4个摄像头即可在三维空间中精确追踪任意点的运动轨迹,追踪精度达2-3厘米。该系统通过创新的点云融合技术和变换器架构,能处理复杂遮挡场景并适应不同质量的深度信息,实现了7.2帧每秒的准实时处理速度,为机器人技术、增强现实等领域带来重要突破。
    至顶网  科技行者  2025-09-05 10:11:00  
  • 揭秘"隐形推理令牌":马里兰大学研究团队开发CoIn系统,为大模型API计费提供透明保障

    CoIn是马里兰大学研究团队开发的创新框架,旨在解决大型语言模型商业API不透明计费问题。这些API隐藏推理过程只显示最终答案,却仍对所有"看不见"的令牌收费。CoIn通过令牌数量验证和语义有效性验证两大组件,使用户能够审计隐藏令牌而不暴露专有内容。实验表明,即使面对复杂攻击,CoIn的检测成功率高达94.7%,为商业AI服务提供了前所未有的计费透明度。
    至顶网  科技行者  2025-05-27 10:11:23  
  • 推荐系统也要"三思而后行":中国人民大学发现让AI推荐更聪明的新方法

    中国人民大学研究团队开发了ReaRec推荐系统,让AI学会"三思而后行"。不同于传统推荐系统的直接反应,ReaRec通过多步推理深度理解用户需求,特别擅长为新用户和小众商品提供精准推荐。实验显示平均性能提升7.49%,理论上限可达30-50%提升,为推荐系统开辟了推理时计算的全新方向。
    至顶网  科技行者  2025-07-30 20:48:50  
  • 腾讯优图实验室突破性成果:只需一张正常图片,AI就能自动发现任何异常!

    腾讯优图实验室提出MetaUAS系统,首次实现仅用一张正常图片就能检测任何类型异常的突破。该技术将异常检测转化为变化检测问题,通过元学习训练通用模型,无需语言描述即可精确识别工业产品瑕疵,参数量仅为传统方法的1/10,推理速度快65倍,为工业质检智能化提供了全新解决方案。
    至顶网  科技行者  2025-07-10 09:35:54  
  • 从开源基础设施上海峰会我看到了一些变化与不变

    云计算已经发展到新的阶段,而OpenStack以及背后的基金会也在积极求变,在顺应技术变化和客户需求方面进行了卓有成效的探索。展望下一个十年,OpenStack的发展值得期待。
    至顶网  李祥敬  2019-11-28 09:47:02  
  • 从脑电波到语言:哥伦比亚大学团队开发Neuro2Semantic框架,仅需30分钟数据就能解读大脑中的语言

    这项哥伦比亚大学研究团队开发的Neuro2Semantic框架,能够从人类颅内脑电图信号中重建语义内容,开创了脑机接口技术的新可能。该框架通过两阶段过程工作:先用LSTM适配器将神经信号与文本嵌入对齐,再用预训练模型将这些嵌入转化为连贯文本。最令人印象深刻的是,它仅需30分钟的训练数据即可实现高效解码,远少于传统方法所需的16小时以上。研究表明该技术在未见过的语义内容上也表现出色,为帮助失语症患者等医疗应用铺平了道路。
    至顶网  科技行者  2025-07-07 17:36:29  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号