用了 0.061830秒,为您找到大小 单双 技巧 集锦 罔芷 88pkee 驻测相关内容1228 条
  • DeepL发展史:一家初创公司与机器翻译巨头的抗争

    机器翻译越来越好用,但外语学习还是不能停。
    至顶网  The Next Web  2024-01-25 09:54:06  
  • 素描几笔就能找到关键点:加利福尼亚大学和萨里大学团队的跨模态AI识别突破

    加利福尼亚大学和萨里大学研究团队开发了一种创新的AI系统,能够仅通过简单的手绘素描就在复杂照片中精确识别关键点。这项技术突破了传统机器学习需要大量同类数据的限制,实现了真正的跨模态学习。系统在动物关键点识别任务中达到了39%的准确率,超越现有方法约5个百分点,并且在真实手绘素描测试中表现稳定。该技术有望在生物学研究、医疗诊断、工业检测等多个领域找到广泛应用。
    至顶网  科技行者  2025-07-21 14:37:54  
  • 希伯来大学开发的免费AI导演:一句话变多幅电影级故事板

    希伯来大学研究团队开发的Story2Board系统实现了从文字故事到专业故事板的自动转换突破。该系统采用潜在面板锚定和相互注意力数值混合两项核心技术,在保持角色一致性的同时实现丰富的视觉表现力。系统无需训练即可运行,能够生成电影级构图效果的连续画面,为内容创作、教育和娱乐产业提供了强大的AI辅助工具,代表了人机协作创作的新模式。
    至顶网  科技行者  2025-10-10 10:32:06  
  • MIT实验室打造音频界"翻译官":一个模型搞定语音、音乐和环境声

    这篇论文介绍了MIT开发的USAD技术,这是一种能够同时理解语音、音乐和环境声音的通用音频AI模型。通过创新的知识蒸馏方法,USAD在多个音频处理任务上都达到了接近专门模型的性能水平,为构建更智能的音频理解系统奠定了基础。该技术在智能助手、多媒体处理、教育等领域具有广阔的应用前景。
    至顶网  科技行者  2025-06-27 16:59:36  
  • 解密神秘语言模型:康奈尔大学研究团队突破性融合自回归与扩散技术

    康奈尔大学团队提出的"神秘语言模型"(Eso-LMs)创新性地融合了自回归和掩码扩散模型的优势,实现了两种范式间的平滑过渡。研究最大突破在于首次为掩码扩散模型引入KV缓存技术,同时保留并行生成能力,使推理速度比标准扩散模型快65倍,比半自回归模型快4倍。通过设计特殊的注意力机制和采样策略,Eso-LMs在保持扩散模型并行生成优势的同时,解决了传统扩散模型的效率瓶颈,为语言生成任务提供了质量与速度兼具的新解决方案。
    至顶网  科技行者  2025-06-06 12:24:28  
  • 微软开放小冰计算框架:帮更多企业创造有“同理心”的AI beings

    在第七代微软小冰发布会上,微软宣布将把小冰背后的计算框架通过工具包的方式开放出来,让用户自己轻松构建具有完整情感计算能力的人工智能助手、社交对话机器人、人工智能内容创作和IP人物角色等,从而帮助更多公司创造自己的“AI beings”。
    至顶网  高玉娴  2019-08-16 18:20:25  
  • 俄罗斯莫斯科高等研究中心的全能AI文本分类神器:AutoIntent让机器读懂人类意图变得如此简单

    AutoIntent是俄罗斯研究团队开发的革命性自动化文本分类工具。它能够自动选择最佳的嵌入模型、分类算法和决策阈值,让普通用户无需专业知识就能构建高效的意图识别系统。在标准测试中,AutoIntent不仅准确率超过现有工具,训练效率也提升一倍以上,特别在多标签分类和超范围检测方面表现突出,为AI技术普及化开辟了新路径。
    至顶网  科技行者  2025-10-17 09:04:28  
  • 腾讯Hunyuan3D-Omni:用多种信号精准控制3D物体生成的统一框架

    腾讯Hunyuan3D-Omni通过统一框架整合点云、体素、边界框和骨架四种控制信号,实现精准可控的3D物体生成。采用渐进式训练策略和统一控制编码器,解决了传统单一输入源导致的几何失真问题,为3D内容创作提供了更高的精度和灵活性,在动画制作、游戏开发等领域具有重要应用价值。
    至顶网  科技行者  2025-10-15 13:33:06  
  • 指导你的IT团队进行变革的9个技巧

    让你的团队接受甚至拥抱变革,这对于IT的成功至关重要。掌握了变革领导艺术的IT领导者分享了他们对这一基本领导技能的建议。
    至顶网  至顶网CIO与CTO频道  2024-05-08 10:31:26  
  • Ctrl-Crash:可控制的真实车祸场景生成——蒙特利尔理工学院与蒙特利尔人工智能研究所联合研发突破性技术

    这项由蒙特利尔理工学院与多家研究机构合作的研究开发出Ctrl-Crash系统,该系统能从单一图像生成逼真的车祸视频。系统通过三种控制信号工作:初始图像、车辆边界框序列和碰撞类型。利用扩散模型技术和创新的无分类器引导方法,Ctrl-Crash能生成多种可能的车祸场景,包括反事实情境,为自动驾驶安全测试提供宝贵工具。研究显示该方法在各项视频质量评估中显著优于现有技术,用户研究也证实其生成内容在物理真实感和视觉质量方面均优于竞争方法。
    至顶网  科技行者  2025-06-07 09:51:20  
  • 虚拟人停更潮波及AYAYI,AI都不是虚拟人的救命良药?

    超写实虚拟人AYAYI在元宇宙热潮中迅速走红,但随后影响力衰减,内容更新质量下降,甚至出现争议。燃麦科技背后的团队尽管有潮流IP和动漫内容开发背景,但未能持续利用初期热度,其他虚拟人也面临类似问题。虚拟人行业面临的挑战包括社群建设不足、文化共鸣缺失等,而AI技术的应用在一定程度上可以解决这些问题。燃麦科技开始转型探索实体产品领域,而虚拟人行业的未来仍在探索中。
    至顶网  元宇宙新声  2024-03-14 20:04:19  
  • NVIDIA团队推出SANA-Sprint:让AI画画快如闪电的神奇技术

    NVIDIA团队开发的SANA-Sprint技术实现了AI图像生成的重大突破,将传统需要20步的生成过程压缩至1步,在H100上仅需0.1秒即可生成1024×1024高清图像,速度比现有最快模型提升10倍以上。该技术通过创新的混合蒸馏策略,在大幅提升速度的同时保持了图像质量,并支持实时交互应用,为AI绘画从专业工具向大众应用的转变奠定了基础。
    至顶网  科技行者  2025-07-30 20:51:00  
  • 巴黎萨克雷大学突破图网络公平性难题:让AI生成的关系网络告别偏见

    这项研究首次系统性解决了图扩散模型的公平性问题,提出了FAROS框架,通过在生成过程中智能切换节点属性来消除偏见。该方法无需重新训练模型,在保持准确性的同时显著提升了公平性,在多个数据集上实现了帕累托最优的性能权衡,为构建更公平的AI系统提供了实用工具。
    至顶网  科技行者  2025-07-18 09:33:47  
  • Arc Intelligence的惊人发现:让AI写代码时,随便试试竟然比精心调教更有效

    Arc Intelligence公司的这项研究颠覆了AI优化的传统观念,发现在GPU内核代码生成任务中,简单的"多试几次再选最好的"策略比复杂的"边学边改进"方法效果更好。通过对比实验发现,多样化采样达到90%成功率,而实时训练仅为30.6%。研究还提出了"惊讶度引导选择"策略,选择AI认为意外的正确解决方案,成功率提升30%。这一发现挑战了"更多训练总是更好"的假设,为密集反馈任务的AI优化提供新思路。
    至顶网  科技行者  2026-02-12 13:30:05  
  • 阿里巴巴团队开发Lumos-1:让AI像人一样"思考"制作视频的全新方法

    阿里巴巴团队开发的Lumos-1系统实现了统一架构的AI视频生成突破,通过创新的MM-RoPE三维位置编码和AR-DF训练策略,仅用48块GPU就达到了业界顶尖水平。该系统能够用同一个"大脑"同时处理文字和视频,为AI多媒体生成开辟了新的技术路径。
    至顶网  科技行者  2025-07-21 11:32:15  
  • AI视觉推理新突破:中国团队让机器像人一样"慢思考",仅用5千个文本案例就追平顶级商业系统

    这项由中国人民大学等机构合作完成的研究提出了Virgo系统,发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性,为更经济高效地开发多模态AI系统指明了新方向,同时也揭示了AI感知反思能力不足的局限性。
    至顶网  科技行者  2025-09-15 11:06:51  
  • 亿欧公司黄渊普:四年与四十年

    押宝中国国运+产业创新的深度+国际化的广度+基于合伙人体系的制度创新,这是亿欧应对“新时代”的举措。大多数伟大的公司,都起于弱小。刚满四年、依然弱小的亿欧公司,有机会在未来发展更好。
    至顶网  业界供稿  2018-02-10 10:00:02  
  • 百度AI开放平台3.0 平等赋能成为百度AI关键词

    希望在未来的时间里,有更多的开发者和企业能够加入我们,一起加速人工智能的应用落地,推动产业变革。”7月5日,百度AI技术生态部总经理喻友平在百度AI开发者大会(Baidu Create 2018)百度大脑论坛现场表示。
    至顶网  科技行者  2018-07-08 22:17:22  
  • 看音乐谱竟然这么难?加州大学圣地亚哥分校发现AI在读乐谱上的"视力"问题

    加州大学圣地亚哥分校研究团队创建了首个"野生"乐谱理解AI测试平台WildScore,通过807个来自Reddit音乐社区的真实问题,系统评估了多模态AI模型的乐谱解读能力。测试结果显示,即使最先进的GPT-4.1模型准确率也仅为68%,在节拍识别等方面表现尤其困难。研究揭示了AI在专业符号系统理解方面的局限性。
    至顶网  科技行者  2025-09-19 11:07:44  
  • 构建蓬勃人才生态,为产业输送百万人才

    为了跨越数字时代人才供需的“鸿沟”,华为通过建设人才联盟、融入人才标准、提升人才能力、传播人才价值,构建教育人才生态、公众人才生态、产业/行业人才生态。
    至顶网  业界供稿  2022-03-16 17:05:28  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号