用了 0.123719秒,为您找到mg 性价比 最高 高达 網纸 YB233相关内容9830 条
  • 如何让AI像电影配乐师一样创作完整的长篇音频故事——腾讯ARC实验室团队AudioStory突破性进展

    腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
    至顶网  科技行者  2025-09-10 09:47:04  
  • 曾经无话不谈的好朋友,如今怎么见个面都难

    大飞和方平是两家中小企业的IT总监,老乡会上认识之后,两人很快成了朋友,经常在工作之余一起打打球、爬爬山、喝喝酒、看看电影(同漫威“死忠粉”),几乎无话不谈。
    至顶网  至顶网云计算频道  2019-01-02 10:53:13  
  • VF-EVAL:评测多模态大语言模型为AI生成视频提供反馈的能力

    这项由中国科学院大学、新加坡国立大学、浙江大学和耶鲁大学研究人员联合发表的研究提出了VF-EVAL,一个专门评估多模态大语言模型对AI生成视频提供反馈能力的新基准。研究通过四项任务:连贯性验证、错误感知、错误类型检测和推理评估,全面测试模型理解合成视频的能力。研究发现即使是最先进的GPT-4.1模型也难以在所有任务上保持良好表现,表明AI对生成视频的理解仍有巨大提升空间。研究还通过REPROMPT实验证明,将大模型反馈与人类偏好更好地对齐可以显著提升视频生成质量。
    至顶网  科技行者  2025-06-03 13:33:15  
  • Spotify科学家破解推荐系统难题:用一套"语义身份证"让搜索和推荐完美融合

    Spotify研究团队通过系统性实验发现,传统为搜索或推荐任务单独优化的语义身份证在统一系统中存在严重的性能冲突。他们提出的多任务训练方法能够同时学习查询匹配和用户行为预测,为每个物品生成既适合搜索又适合推荐的统一身份证,在两个任务中都达到良好平衡效果,为构建下一代生成式推荐系统提供了重要技术路径。
    至顶网  科技行者  2025-08-28 11:07:03  
  • 大模型在数学题自我修正中的困境:NAVER与KAIST联合揭示的新基准

    NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理六种错误类型时表现差异巨大,特别是小型模型在空间推理修正上竟然超越了大型模型,颠覆了"越大越好"的认知。
    至顶网  科技行者  2025-06-16 11:29:36  
  • 首次实现真正意义上的"图像记忆":希伯来大学突破3D生成技术瓶颈

    希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
    至顶网  科技行者  2025-09-01 16:00:03  
  • 普渡大学研究团队突破:让人工智能"看见"物体真实大小的神奇方法

    普渡大学研究团队开发的深度平衡正则化器(DEC)解决了AI模型在处理不同大小物体时判断不一致的问题。该方法基于单调缩放群理论,通过潜在空间正则化显著提升了ViT、Swin等模型的尺度一致性和整体准确率,在ImageNet等数据集上表现优异,为自动驾驶、医疗图像分析等应用提供更可靠的视觉识别能力。
    至顶网  科技行者  2025-08-28 11:11:19  
  • 如何成为技术大佬?——一个程序员的蜕变之路

    人生的道路虽然漫长,但紧要处就那么几步,特别是在年轻的时候。
    至顶网  尼酱  2022-06-16 15:50:32  
  • 专访|DoorDash掌门人:从濒临倒闭到主宰美国外卖市场,如何缔造一个全新商业帝国

    DoorDash联合创始人兼CEO Tony Xu(徐讯)与YC董事长Garry Tan展开了一场关于创业精髓的访谈,讲述了公司的起源故事、公司如何在几次危机中幸存下来、以及如何改变整个行业。
    至顶网  周雅  2025-04-09 21:22:44  
  • 智谱AI和清华大学联手打造GLM-4.1V-Thinking:让AI像人类一样深度思考的神奇模型

    智谱AI和清华大学联合发布GLM-4.1V-Thinking视觉语言模型,通过创新的推理导向训练框架,让AI学会像人类一样深度思考后再回答。该模型在多个基准测试中超越了规模更大的竞争对手,并首次在开源社区提供了完整的多模态推理解决方案,为AI技术的实际应用开辟了新路径。
    至顶网  科技行者  2025-07-03 14:00:35  
  • 南洋理工大学团队创新突破:让3D建模像拼图一样简单,多模态数据协同创作高质量3D内容

    新加坡南洋理工大学研究团队提出TriMM系统,这是首个融合RGB图像、深度图和点云数据的3D生成模型。通过协同多模态编码技术,系统能够同时利用彩色图像的丰富纹理和几何数据的精确结构信息,仅用4秒即可从单张图片生成高质量3D模型。该技术在多个数据集上的表现超越现有方法,为3D内容创作提供了新的解决方案。
    至顶网  科技行者  2025-09-04 09:59:44  
  • Yale研究团队突破传统:Table-R1开创表格推理的全新境界

    Yale大学自然语言处理实验室研发的Table-R1模型突破性地将推理时间缩放技术应用于表格推理任务。研究团队通过两种方法提升模型能力:从DeepSeek-R1模型的推理过程中学习,以及利用可验证奖励进行强化学习。实验表明,即使使用仅有7B参数的模型,Table-R1-Zero也能在13个表格推理基准测试中媲美甚至超越GPT-4.1等大型模型。该研究不仅证明了中小规模模型通过适当训练也能实现出色表现,还为数据分析、科学研究和决策支持系统等实际应用提供了新可能。
    至顶网  科技行者  2025-06-03 17:39:47  
  • 让AI学会真正理解人类情感:腾讯研究团队首次用真情实感训练出会安慰人的AI助手

    腾讯研究团队首次开发出RLVER框架,通过可验证的情感反馈训练AI理解人类情感。该方法让70亿参数的小型AI模型在情感智能测试中从13.3分跃升至79.2分,达到大型商业模型水平。研究创新性地使用虚拟用户的真实情感变化作为训练信号,并发现"先思考再回应"模式显著提升AI的共情能力。这项突破为AI情感智能发展开辟新路径,有望在心理健康支持、教育和客户服务等领域产生广泛应用。
    至顶网  科技行者  2025-07-17 13:56:57  
  • 共谱数据的冰与火之歌:Techo TVP 开发者峰会圆满落幕!

    2021年4月24日,由腾讯云 TVP 主办的首届 Techo TVP 开发者峰会「数据的冰与火之歌——从在线数据库技术,到海量数据分析技术」在深圳深铁皇冠假日酒店成功举办。
    至顶网  业界供稿  2021-04-29 09:45:13  
  • watsonx新篇章:IBM宣布开源、产品及生态系统的多项创新以推动企业级AI的规模化应用

    昨天晚上,在美国波士顿举行的一年一度THINK大会上,IBM宣布了有关一年前发布的watsonx 平台的几项新的更新,以及即将推出的新的数据与自动化功能,旨在使人工智能(AI)对企业而言更具开放性、成本效益与灵活性。
    至顶网  业界供稿  2024-05-23 08:58:43  
  • 黄仁宇的理想国和AI驱动的未来企业

    从万物连接到万物智能,组织中的数据洪流让数目字管理变成不再遥不可及,让黄仁宇的“理想国”在技术上成为可能,我们对此做好准备了么?
    至顶网  高飞、周雅  2018-11-09 16:27:57  
  • 一场数据架构变革正在来临

    现有数据架构难以支撑现代化应用的实现。
    至顶网  至顶网CIO与CTO频道  2021-12-21 18:29:35  
  • 大语言模型的"分层蛋糕":东南大学最新研究让AI不再"胡说八道"

    东南大学研究团队开发的LayerCake方法通过分析大语言模型内部的"分层蛋糕"结构,发现不同层次处理不同类型信息的规律,创新性地采用对比解码技术来减少AI生成错误信息的问题。该方法在多个测试中显著提升了模型的事实准确性,为AI安全应用提供了重要技术支撑。
    至顶网  科技行者  2025-07-22 09:25:20  
  • 物声相应:交互式感知物体的图像到音频生成技术——加州大学伯克利分校与字节跳动联合研究突破

    这项研究提出了一种交互式物体感知的图像到音频生成模型,让用户能够针对图像中选定的特定物体生成相应声音。研究团队将物体中心学习整合到条件潜在扩散模型中,通过多模态注意力机制学习图像区域与声音的对应关系。用户可通过分割蒙版选择目标物体,系统会精确生成相关音频。理论分析证明其注意力机制在功能上等同于测试时的分割蒙版,确保了生成音频与选定物体的准确对应。实验表明该模型在声音-物体对齐方面显著优于现有技术,为内容创作、虚拟现实和辅助技术等领域开辟了新可能。
    至顶网  科技行者  2025-07-07 17:33:28  
  • AI智能体的新思路:CMU团队发现"多行动"比"深思考"更有效

    卡内基梅隆大学团队发现AI智能体"多试试"比"多想想"更有效的新规律。研究提出TTI方法,通过增加交互步骤而非延长单步思考时间来提升性能。在网页任务中,该方法让AI学会探索、比较和调整策略,在WebVoyager和WebArena基准测试中创下开源模型新纪录。这一发现挑战了传统"深思考等于高智能"的假设,为构建更适应复杂现实环境的AI系统开辟了新方向。
    至顶网  科技行者  2025-06-16 11:29:03  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号