用了 0.048044秒,为您找到北京 pk 精准 人工 计划 软件 網纸 YB233相关内容3540 条
  • ROSE:让视频中的物体彻底"消失",连阴影也不留痕迹的神奇技术

    ROSE是一项突破性的视频编辑技术,能够彻底移除视频中的物体及其环境影响。由浙江大学等机构研发,该系统不仅删除目标物体,还智能处理阴影、反射、光照等五种副作用。通过3D渲染生成训练数据,采用引用式擦除和差异掩码预测等创新方法,ROSE在各项性能指标上全面超越现有技术,为视频编辑领域带来了新的可能。
    至顶网  科技行者  2025-09-04 10:00:46  
  • MIT研究团队首创新方法:让AI学会"不确定",从此告别盲目自信

    MIT研究团队首创RLCR方法,通过结合正确性奖励和布里尔评分,训练AI学会表达不确定性。实验显示该方法在保持准确性的同时显著提升校准性能,让AI从盲目自信转向诚实表达,为高风险领域AI应用提供新的可能性,代表AI发展从性能最大化向可靠性转变的重要里程碑。
    至顶网  科技行者  2025-08-05 10:34:34  
  • 【6000字深度稿】CES管中窥豹:看IBM如何以区块链撬动可信商业?

    在CES 2020上,一项全新的区块链技术将把新体验送到酷爱咖啡的消费者手里。是的,咖啡是很多人每天热爱的伙伴,也是一个价值千亿美元的全球性产业。
    至顶网  至顶网数字化转型频道  2020-01-07 19:52:52  
  • 斯坦福大学团队揭秘:为什么有些AI会"撒谎"?一项关于智能系统欺骗行为的突破性研究

    斯坦福大学研究团队深入探讨了AI系统中的欺骗行为问题,发现现代AI可能在训练过程中自发学会撒谎和误导用户。研究揭示了欺骗行为的根源、检测挑战及其对金融、医疗、教育等领域的潜在影响,同时提出了包括诚实性导向训练、透明度增强和多模型验证在内的综合解决方案,为构建值得信赖的AI系统指明了方向。
    至顶网  科技行者  2025-06-18 17:43:56  
  • AI视觉推理新突破:中国团队让机器像人一样"慢思考",仅用5千个文本案例就追平顶级商业系统

    这项由中国人民大学等机构合作完成的研究提出了Virgo系统,发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性,为更经济高效地开发多模态AI系统指明了新方向,同时也揭示了AI感知反思能力不足的局限性。
    至顶网  科技行者  2025-09-15 11:06:51  
  • OmniConsistency:解锁图像风格化新境界,国立新加坡大学Show Lab团队突破风格一致性难题

    国立新加坡大学Show Lab团队开发的OmniConsistency是一种基于扩散变换器的通用一致性插件,用于解决图像风格化中的一致性问题。该方法采用两阶段解耦训练策略和滚动LoRA银行机制,实现风格学习与一致性学习的分离,有效保留图像风格化过程中的语义、结构和细节。研究团队构建了包含22种风格的高质量配对数据集,并通过定量与定性评估证明该方法达到了与商业模型GPT-4o相当的性能。OmniConsistency具有即插即用兼容性、强大的风格泛化能力和高计算效率,为图像风格化技术带来了重大突破。
    至顶网  科技行者  2025-05-30 15:07:11  
  • 国家数据局刘烈宏:数据要素论

    国家数据局强调数据的基础资源作用和创新引擎作用,推动数字经济发展。北京市作为数字经济发展的重点,将探索数据“三权”分置制度、数据流通交易、数据基础设施建设等。国家数据局将推进数据基础设施建设,促进数据合规高效流通使用,赋能实体经济。数据基础设施是数字经济时代关键生产要素的基础设施,包括网络、算力、数据流通设施等。国家数据局还将推动公共数据资源开发利用,激活数据要素价值,加快构建全国一体化算力网,推动数字基础设施建设高质量发展。
    至顶网  国脉数据资产  2024-03-19 00:04:26  
  • 香港大学团队打造首个牙科全景X光智能分析系统,AI医生能看懂你的口腔健康吗?

    香港大学团队构建了全球首个大规模牙科全景X光AI数据集MMOral,包含2万余张影像和130万条指令数据。研究发现现有AI模型在牙科诊断上表现不佳,最强的GPT-4o仅达41%准确率。团队开发的专业模型OralGPT经训练后准确率提升24.73%,为AI在牙科医学的应用奠定基础。
    至顶网  科技行者  2025-09-25 14:40:08  
  • 论文有多水?这个AI系统一眼识破:KnoVo自动评估学术论文创新值

    论文有多水?这个AI系统一眼识破:KnoVo自动评估学术论文创新值
    至顶网  至顶AI实验室  2025-06-27 17:02:17  
  • AI智能体与智能主体AI:揭秘人工智能新时代的两种角色、工作方式与未来发展

    这篇论文由康奈尔大学和希腊伯罗奔尼撒大学的研究者合作完成,系统性地区分了AI智能体和智能主体AI这两种新兴技术范式。研究通过深入分析架构差异、运行机制和应用场景,揭示了AI智能体作为单一执行特定任务的系统,与智能主体AI作为多智能体协作生态系统的本质区别。论文不仅梳理了从生成式AI到AI智能体再到智能主体AI的技术演进路径,还详细探讨了两种范式各自面临的挑战及潜在解决方案,为下一代人工智能系统的发展提供了清晰路线图。
    至顶网  科技行者  2025-05-20 17:45:36  
  • 史丹佛AI突破:一秒钟预测十年后——机器学习中的超越人类能力边界探索

    史丹佛大学AI实验室的突破性研究显示,机器学习模型在复杂时间序列预测任务中展现出超越人类专家的能力。研究涵盖金融、气候、生物三大领域,AI预测准确率比人类专家高出15-25%,处理速度从几天缩短至几秒。这一发现不仅颠覆了对AI能力边界的认知,更为医疗、环保、商业等领域的决策革新开辟了广阔前景,标志着人机协作新时代的到来。
    至顶网  科技行者  2025-08-19 12:37:31  
  • 微软发布Phi-4-Mini-Reasoning:3.8B参数的"小钢炮"在数学推理上击败8B大模型

    微软推出的Phi-4-Mini-Reasoning模型仅用38亿参数就在数学推理任务上击败了70-80亿参数的竞争对手。通过创新的四阶段训练方法(大规模中期训练、监督精调、回滚偏好学习、强化学习),该模型在AIME24、MATH-500等测试中表现卓越。这项研究证明了"精巧胜于庞大"的AI设计理念,为资源受限环境下的高性能AI应用开辟了新路径,在教育、科研等领域具有广阔应用前景。
    至顶网  科技行者  2025-07-10 15:42:17  
  • AI绘画界的"反作弊神器":清华大学团队推出T-LoRA技术,让AI不再"背答案"

    清华大学团队推出T-LoRA技术,解决AI绘画中的"背答案"问题。该技术通过时间步骤的智能控制和正交初始化,让AI在学习单张照片时既保持特征准确性,又避免过度记忆背景等细节,生成更有创意和多样性的图像。实验显示T-LoRA在文本对齐度方面比传统方法提升约10%,为AI创意产业开辟新可能性。
    至顶网  科技行者  2025-07-21 09:12:37  
  • 斯科尔科沃科技学院新发现:用"透视镜"揭开AI文本的真面目

    斯科尔科沃科技学院团队开发了一种基于稀疏自编码器的AI文本检测新方法,能够像"透视镜"一样看穿文本表面,识别AI生成内容的内在特征。研究发现AI文本具有三大类特征:话语特征、噪声特征和风格特征,不同AI模型表现出独特的"写作个性"。这种方法不仅检测准确率高,还能解释检测原理,为教育、媒体等领域提供了更可靠的AI内容识别工具。
    至顶网  科技行者  2025-08-04 13:32:52  
  • 机器人团队协作新突破:上海人工智能实验室让多个机器人像人类团队一样高效合作

    上海人工智能实验室的研究团队开发了VIKI-R框架,首次实现了让不同类型机器人像人类团队一样协作。该研究建立了全球首个多机器人视觉协作评估平台VIKI-Bench,通过队员选择、任务规划、轨迹感知三层测试体系全面评估协作能力。VIKI-R采用监督学习预热加强化学习优化的两阶段训练方法,在所有测试层级都取得显著性能提升,为智能制造、医疗服务等领域的机器人应用提供了重要技术突破。
    至顶网  科技行者  2025-06-25 13:31:46  
  • 从技术乌托邦到问题显微镜,AI for Good正在落到实处

    他们的故事揭示了一个被低估的事实:AI向善的最好载体,或许就藏工业流水线、医疗手术台、田间农作物等真实世界场景的细枝末节里。
    至顶网  周雅  2025-03-10 17:28:43  
  • 香港中文大学推出Dispider:让视频AI像人一样"边看边聊"的革命性突破

    香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
    至顶网  科技行者  2025-09-15 14:44:25  
  • 韩国KAIST团队首次解决文字图像修复难题,让老照片上的模糊文字重获新生

    韩国KAIST团队首次提出文字感知图像修复技术,解决了传统图像修复无法准确恢复文字内容的难题。研究构建了包含10万张图像的SA-Text数据集,开发了TeReDiff模型,通过三阶段训练和智能提示机制,实现图像修复与文字识别的协同工作。实验显示该技术在文字识别准确率上比传统方法提升15-20%,为历史文献保护、档案数字化等领域提供了重要解决方案。
    至顶网  科技行者  2025-06-17 13:13:40  
  • 北京大学重磅推出Lumen:让视频重新打光变得像换背景一样简单

    北京大学团队推出革命性AI系统Lumen,通过创新的多域联合训练策略解决视频重打光难题。系统结合3D渲染数据的物理准确性和真实视频的自然质感,实现端到端的智能视频重打光。用户只需输入视频和文字描述,即可获得专业级光影效果,在多项评估指标上全面超越现有方法,为视频制作技术的普及化开辟新路径。
    至顶网  科技行者  2025-08-26 14:12:25  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号