用了 0.050545秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容3164 条
  • 武汉大学团队巧用AI进化算法揭示语言模型"过度警惕"现象:机器人何时变得太过谨慎?

    武汉大学团队开发了EVOREFUSE系统,通过进化算法生成能触发AI过度拒绝的伪恶意指令。研究发现AI存在"捷径学习"问题,过度关注敏感词汇而忽略语境。团队创建的测试数据集在9个模型上的触发率比现有最佳方案高140%,训练数据集可使模型过度拒绝减少40%同时保持安全性。该研究为AI安全测试和训练提供了新工具和理论洞察。
    至顶网  科技行者  2025-06-12 09:54:09  
  • 北京科学院联合字节跳动重磅发布:让AI真正"看懂图片思考"的全新评测基准和训练方法

    中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
    至顶网  科技行者  2025-07-18 16:07:11  
  • 站在云端高瞻远瞩:四家企业的数字化转型成功案例

    在疫情这段史无前例的时期之后,云已经从一个单一用途的计算和存储IaaS,发展成为一个更为复杂的平台,能够支持新型的高级应用,并被CIO们称为下一代创新引擎。
    至顶网  至顶网CIO与CTO频道  2022-11-09 11:53:08  
  • 双专家一致性模型:高效高质量视频生成的解决方案 - 香港大学和南京大学联合研究突破

    这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
    至顶网  科技行者  2025-06-07 08:29:19  
  • 伊利诺伊大学香槟分校首创视觉对抗推理:揭秘AI分割模型的幻觉漏洞

    伊利诺伊大学研究团队开发了HalluSegBench评估系统,首次系统性揭示AI视觉分割模型的"幻觉"问题。通过创建1340对对比图像和四种新评估指标,研究发现当前先进AI模型普遍存在错误识别不存在物体的严重缺陷,且视觉变化比文字变化更容易引发幻觉。该研究为提升AI系统可靠性提供了重要工具和理论基础。
    至顶网  科技行者  2025-07-07 12:16:22  
  • 凯文·凯利2018最新演讲:未来25年将发生什么

    《连线》杂志创始主编凯文·凯利发表了《What is Next》的主题演讲。凯文·凯利被看作是“网络文化”的发言人和观察者,他的书可能大家也很了解,《失控》《科技想要什么》和《必然》等书籍,影响了很多信息科技领域的从业者,人们也经常亲昵地称他为KK,
    至顶网  至顶网存储频道  2018-07-11 16:47:39  
  • 改写多模态AI的"火眼金睛":上海AI实验室让机器学会逐步推理判断

    上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
    至顶网  科技行者  2025-07-30 10:01:14  
  • 生成式AI正在重塑社交媒体营销,人机平衡成关键

    生成式AI已渗透到社交媒体的各个层面,96%的社交媒体管理者使用AI工具辅助工作。AI主要用于内容创意生成、文案写作和文本改写等任务,帮助专业人士应对多平台运营压力。然而AI使用也面临质量问题、品牌个性丧失和用户反感等风险。专家建议AI可作为"超级助手"处理基础工作,但创意决策和敏感沟通仍需人工把控,关键是在提升效率与保持人性化连接间找到平衡。
    至顶网  cnet  2025-08-25 08:01:01  
  • AROS 通过 USB 启动发行版将任何 PC 变成 Amiga

    AROS 是一款自由、开源的 AmigaOS 重现操作系统,现能以 USB 启动方式在 PC 上运行。它借助 Linux 系统与 QEMU 虚拟化技术,实现了经典 Amiga 环境的体验。
    至顶网  The Register  2025-05-27 11:20:23  
  • 人工智能的自学奇迹:清华大学研究团队开创"无师自通"的AI学习新方法

    想象一下这个场景:一位学生拿到了一套没有标准答案的数学题。正常情况下,没有答案怎么知道自己做得对不对呢?大多数学生会卡在这一步。但如果这位学生非常聪明,他会想出一个办法——先用不同的解题思路做几遍,然后看哪个答案出现的次数最多,那个答案很可能就是正确的。接着,他会思考为什么其他方法得到了不同的答案,从而改进自己的解题技巧。这就是清华大学研究团队开发的"测试时强化学习"(TTRL)的核心思想。
    至顶网  科技行者  2025-04-24 14:24:43  
  • 95%员工用上大模型,明略科技想让更多企业拿到大模型船票

    2023年8月,在行业对模型层的讨论还热火朝天的时候,洞察到企业用户不知道选哪种大模型,难以在业务场景落地等诸多痛点,明略科技将目光转向应用层,基于大模型的应用产品——小明助理Copilot就这样诞生了。
    至顶网  业界供稿  2024-02-28 16:26:18  
  • 控制随心,视频随意:ByteDance智能创作的ATI轨迹控制系统如何彻底改变视频生成技术

    ByteDance智能创作团队推出的ATI系统彻底改变了视频生成技术的控制方式。这个统一框架通过简单的点轨迹同时实现相机移动、物体平移和局部变形控制,不再需要分散的工具。用户只需在初始图像上标记关键点并绘制运动路径,系统就能生成符合指令的高质量视频。研究表明,ATI不仅提高了控制精度,还能兼容多种顶级视频生成模型,有望让专业级视频创作变得更加直观简单。
    至顶网  科技行者  2025-06-04 11:15:24  
  • 复旦大学团队突破多模态AI理解瓶颈:让机器像人一样"看懂"图片不再靠猜测

    复旦大学等机构联合提出ASVR方法,通过自回归语义视觉重构解决大型视觉语言模型过度依赖文字监督的问题。该方法让AI同时学习视觉和文本信息,在14个多模态理解基准上平均提升5个百分点。研究发现语义重构比像素重构更有效,且方法在不同架构、数据规模和分辨率下均表现稳健,为AI视觉理解能力提供了新的技术路径。
    至顶网  科技行者  2025-06-16 10:57:34  
  • 7000万高质量视频文本对!文生视频最大的开源数据集Panda-70M来了!

    数源AI推荐的论文介绍了Panda-70M数据集,该数据集通过多模态教师模型自动为7000万个视频生成高质量字幕。研究表明,该数据集在视频字幕生成、视频文本检索和文本驱动视频生成等下游任务上表现优异。
    至顶网  数源AI  2024-03-05 17:04:20  
  • 视觉赋能大脑:让多模态大语言模型在真实空间中看见、思考与控制

    这项由上海人工智能实验室等机构联合发布的研究提出了VeBrain框架,成功解决了多模态大语言模型在现实世界应用中的关键挑战。VeBrain通过将机器人控制重新定义为2D视觉空间中的文本任务,统一了多模态理解、视觉空间推理和物理控制三大能力。研究团队还创建了包含60万条高质量指令数据的VeBrain-600k数据集,并设计了创新的机器人适配器将模型决策转化为实际运动。实验结果表明,VeBrain在13个多模态基准和5个空间智能基准上表现优异,并在实际机器人应用中展示出强大的适应性和组合能力。
    至顶网  科技行者  2025-06-06 17:29:14  
  • PDF 数据提取:为何依然是数据专家的噩梦

    多年来,企业、政府和研究人员一直在努力解决从 PDF 文件中提取可用数据的难题。PDF 文件虽然广泛应用于存储各类文档,但其固定格式常常使数据难以被机器读取和分析。传统 OCR 技术在处理复杂布局时效果欠佳,而新兴的 AI 语言模型虽有潜力,但也存在幻觉和误解等问题。目前仍无完美解决方案,这个挑战将持续影响数据分析和机器学习领域。
    至顶网  Arstechnica  2025-03-12 15:15:07  
  • 图层式记忆:让AI图像编辑如魔法般简单直观

    想象一下这个场景:你想要创建一幅有趣的图片,先画一片森林,然后在森林中放一个乐高小人,再放一辆吉普车,最后添加一只坐着的小狗。听起来很简单,对吧?但使用当前的AI图像编辑工具,这个任务却出奇地困难。
    至顶网  科技行者  2025-05-06 12:05:21  
  • CIO 传奇人物 Andi Karaboutis 谈每位 IT 领导者都应该掌握的技能

    安迪·卡拉布蒂斯是一位杰出的CIO,她的职业生涯横跨多个行业和地区,经历了多次变革时刻。她在福特和通用汽车锻炼了领导力和技术专长,后来在戴尔、拜奥根和国家电网等公司担任高管,推动战略创新。本文总结了她对IT领导者核心技能的见解,包括战略沟通、情商、协作、远见卓识、变革管理和敏捷性等,对当今IT领导者具有重要参考价值。
    至顶网  CIO.com  2025-04-04 11:36:18  
  • 国产大模型“狂禅式”的训练范式急需变革

    作者按:人工智能的浪潮正以前所未有的势头席卷全球,国产大模型在这一波澜壮阔的变革中,展现出了令人瞩目的雄心与活力。然而近期国产大模型暴露出的问题不可忽视,甚至到了不味不快的程度。本文力图揭露国产大模型的训练范式上的缺陷,希望对业界有所裨益。
    至顶网  吕森林  2025-07-10 08:59:05  
  • MiniMax 突破语音合成极限:全新 MiniMax-Speech 技术让 AI 说话更像真人

    当我们使用导航应用听取路线指引,或者让数字助手朗读新闻时,我们听到的AI语音正在变得越来越自然,但仍然存在明显的局限性。传统的语音合成技术往往需要大量特定说话者的录音样本才能生成接近自然的语音,而且在切换到不同说话者、不同语言或不同情绪风格时往往表现不佳。
    至顶网  科技行者  2025-05-15 14:00:45  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号