用了 0.062732秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容3164 条
  • StructEval: 全面评测大型语言模型生成结构化输出的能力

    这项研究提出了STRUCTEVAL,一个全面评估大语言模型生成结构化输出能力的基准测试。研究涵盖18种格式和44种任务类型,分为不可渲染(JSON、YAML)和可渲染(HTML、React)两大类。评测揭示即使最先进模型如GPT-4o也仅达到76.02%平均分,开源模型落后约10个百分点。研究发现,生成任务比转换任务更具挑战性,可视内容生成比纯文本结构更难掌握。某些任务(如Text→Markdown)已被很好解决,而另一些(如Text→Mermaid)仍然困难。这一基准为未来语言模型在处理结构化数据方面的进步提供了重要指导。
    至顶网  科技行者  2025-05-30 09:45:48  
  • 微软亚洲研究院新发现:计算机也能像人类一样从说话声音中"听出"面部表情

    微软亚洲研究院开发的AV-DiT系统实现了音视频联合生成的重大突破,能够像人类一样理解声音与面部表情的对应关系。该系统采用扩散变换器架构,通过创新的注意力机制和分层处理策略,实现了高质量的音视频同步生成。实验显示其生成内容接近真实水平,在视频会议、内容创作、教育等领域具有广阔应用前景,代表了多媒体理解技术的重要进展。
    至顶网  科技行者  2025-09-29 14:29:44  
  • HiScene:用等轴视图打造具有层次结构的3D场景

    想象一下,你想要为游戏、虚拟现实体验或室内设计应用创建一个逼真的3D客厅。传统上,这需要专业的3D设计师花费数小时甚至数天的时间来建模、调整和布置每个物体。而现在,人工智能领域已经取得了令人瞩目的进展,尤其是在2D图像生成和单个3D物体生成方面。只需输入一段文字描述,AI就能创建出令人惊叹的图像或复杂的3D物体。
    至顶网  科技行者  2025-04-21 15:21:01  
  • 智算“破壁者”:华为穿越AI生态周期的两张“底牌”

    在算力“狂飙突进”的表象之下,华为正试图用“鲲鹏”与“昇腾”两张“底牌”,给出新的解题思路。
    至顶网  毛烁  2025-05-27 15:08:49  
  • 赋能公民开发者 Mendix掘金中国低代码应用开发市场

    西门子数字化工业软件全球高级副总裁兼大中华区董事总经理梁乃明表示, Mendix提供了低代码、零代码的开发平台,无论专业开发者还是“公民开发者”,都可以通过直观的图形化用户接口,使用拖拽组件和模型逻辑来创建企业级应用,速度比传统开发快10倍以上。
    至顶网  李祥敬  2021-01-25 14:21:58  
  • 这些代码"变色龙"能适应不同版本的代码库吗?瑞士科学家们的惊人发现

    瑞士和德国研究团队通过创建GitChameleon测试平台,发现当前最先进的AI编程助手在处理特定版本代码库时成功率仅48-51%。研究揭示了AI系统的"版本困惑症"问题,即难以准确区分不同版本库的用法差异。通过自我调试和文档检索等方法可显著改善AI表现,为未来开发更可靠的版本感知AI编程助手提供了重要参考。
    至顶网  科技行者  2025-07-23 19:03:54  
  • AI智能演示制作助手:让文档秒变生动演讲视频的黑科技来了

    澳大利亚研究团队开发出PresentAgent,这是一个能将任何文档自动转换为专业演示视频的AI系统。该系统集成了文档解析、幻灯片设计、语音合成等功能,并创建了全新的多维度评价体系。实验显示,AI生成的演示视频在多项指标上接近人类专家水平,为教育、商业等领域的演示制作提供了高效解决方案。
    至顶网  科技行者  2025-07-11 09:51:22  
  • 双减,35+,教培行业中的大龄程序员该何去何从?

    在偏爱年轻化的互联网行业,35岁往往是程序员不能迈过的一道重要门槛,大龄就被优化的势头愈演愈烈,35+程序员的未来空间被压缩得越来越小。但是否有比这更糟糕的情况呢?有!那就是双减政策下教培行业的大龄程序员。
    至顶网  尼酱  2022-05-25 15:55:29  
  • 来自IBM THINK 2024的六大启示

    汇聚全球5000多位商业、技术领导人,以及IBM行业客户、合作伙伴的IBM THINK大会,两周前在美国波士顿结束。
    至顶网  业界供稿  2024-06-19 11:23:49  
  • GPT-5真的实现了空间智能吗?SenseTime团队万亿token实测揭露真相

    SenseTime研究团队通过超过十亿token的大规模测试,全面评估了GPT-5等先进AI模型的空间智能水平。研究将空间智能分解为六种核心能力,发现GPT-5虽在某些简单任务上接近人类水平,但在复杂空间推理方面仍存在巨大差距。该研究揭示了当前AI发展的重要盲点,为未来空间智能研究提供了标准化评估框架。
    至顶网  科技行者  2025-08-26 14:18:19  
  • 人工智能学会了看懂动作!复旦大学团队的视频识别新突破

    复旦大学研究团队开发了MOVE数据集和DMA算法,让AI系统能够像人类一样根据动作模式而非外观来理解视频内容。该系统包含224个动作类别和26万帧标注数据,通过解耦动作与外观特征,实现了突破性的视频分割效果。这项技术在视频编辑、体育分析、安防监控等领域具有广阔应用前景,代表了从静态识别向动态理解的重要技术进步。
    至顶网  科技行者  2025-08-05 10:36:22  
  • SCB 10X团队重磅突破:金融界的AI助手终于学会了专业推理

    SCB 10X团队开发了FinCoT方法,通过将金融专家推理流程嵌入AI提示中,显著提升了大语言模型在金融任务上的表现。该方法在CFA考试题目上将准确率从63.2%提升至80.5%,同时将输出长度减少8倍,为AI在专业金融领域的应用提供了新思路。
    至顶网  科技行者  2025-06-27 10:26:26  
  • 告别繁琐优化:东卡罗来纳大学团队让3D高斯点云风格转换变得像变魔术一样简单

    东卡罗来纳大学研究团队开发出一种革命性的3D高斯点云风格转换技术,无需重建或优化即可将任意风格应用到3D场景。通过构建表面图形网络,该方法将2D风格转换技术巧妙移植到3D空间,处理速度从传统的20分钟到3小时缩短至1-2分钟,且可在普通消费级硬件运行,为3D内容创作带来前所未有的便利性。
    至顶网  科技行者  2025-08-15 08:50:01  
  • 跨越AI 1.0到2.0,明略科技营销大模型赛道下的创新与发展

    无论是AI 1.0还是AI 2.0时代,数据毫无疑问一直都是非常重要的生产要素。尤其是在大模型时代,数据质量直接影响模型效果。对于入局大模型赛道的企业玩家来说,手握优质数据意味着绝对性优势。而明略,则将赛道锚定在了营销领域。
    至顶网  李祥敬  2023-09-27 14:50:02  
  • 守护风雨中的古建筑:一手遥控,数条航线,一个伟大的梦

    拯救正在消失的人类文明。
    至顶网  黄当当  2021-11-24 10:36:59  
  • 东南亚文化"被遗忘"?新加坡等高校首次大规模收集1.28M张东南亚文化图像,揭示AI视觉模型的文化盲区

    新加坡国立大学等机构首次构建包含128万张图像的东南亚文化视觉数据集SEA-VL,解决AI系统文化认知偏见问题。研究采用人工众包、自动筛选、AI生成三种方法收集数据,发现自动筛选效率最高且质量可靠,而AI生成图像质量较差。该数据集覆盖东南亚全部11国文化元素,将为开发更公平包容的AI系统提供重要基础。
    至顶网  科技行者  2025-08-04 11:14:23  
  • 人工智能视觉推理的新突破:让机器像人类一样解释图像后再回答问题

    这项由蒙纳士大学等多所知名院校合作完成的大型综述研究,系统回顾了组合式视觉推理领域的最新进展。研究发现,让人工智能像人类一样"解释后再回答"的组合式方法,在准确性、可解释性和可信度方面都显著优于传统"黑盒子"方法,为构建更可靠的人工智能视觉系统指明了发展方向。
    至顶网  科技行者  2025-09-01 15:51:24  
  • 香港大学团队突破AI文生图技术瓶颈:让机器真正"看懂"你说的话

    这项研究解决了AI文生图技术中文字描述与图像生成不匹配的核心问题。通过开发TACA方法,研究团队发现并修复了现有系统中注意力机制的两个关键缺陷:跨模态注意力抑制和时间不敏感性。实验显示该方法能显著提升模型的空间关系理解能力和属性绑定准确性,为AI创意工具的实用化发展提供了重要技术突破。
    至顶网  科技行者  2025-06-12 13:04:58  
  • 四步搞定图像编辑:清华和AIRI的循环一致性模型让修图变得又快又好

    清华和AIRI研究团队提出循环一致性图像编辑方法,仅需4步即可实现高质量图像编辑,速度比传统方法快10倍。该方法通过训练AI反复练习"看图-重画"过程提升图像理解能力,结合智能引导机制确保编辑质量,在多项评测中超越现有快速方法,为AI图像编辑的普及应用奠定基础。
    至顶网  科技行者  2025-06-30 11:21:52  
  • 1比特革命:微软发布首个开源原生1比特大语言模型 BitNet b1.58 2B4T

    微软研究院的研究团队近日发布了一项突破性成果——BitNet b1.58 2B4T,这是首个开源的、原生1比特大语言模型(LLM)。
    至顶网  科技行者  2025-04-18 16:37:56  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号