搜一下
用了 0.063632秒,为您找到
mg
性价比
最高
高达
網纸
YB233
相关内容5680 条
AI视觉系统告别"睁眼说瞎话":厦门大学团队发明TARS技术让机器准确描述图像内容
厦门大学团队开发的TARS技术通过创新的"最大-最小"博弈策略和频谱对齐方法,有效解决了AI视觉系统的幻觉问题。该技术仅用4800个训练样本就将描述错误率从26.4%降至13.2%,性能媲美GPT-4o,为医疗诊断、自动驾驶等关键领域提供了更可靠的AI视觉解决方案。
至顶网
科技行者 2025-08-06 11:14:04
KAIST团队推出Mol-LLaMA:首个能真正"看懂"分子的AI助手,药物发现新时代来临
韩国KAIST团队开发的Mol-LLaMA是首个能像化学专家一样理解分子并解释其性质的AI系统。该系统通过融合2D和3D分子信息,不仅能准确预测分子特性,还能详细解释背后的科学原理,在药物发现、化学教育等领域展现出巨大应用潜力,为分子科学研究开启了AI辅助的新时代。
至顶网
科技行者 2025-08-22 09:34:37
北京科学院联合字节跳动重磅发布:让AI真正"看懂图片思考"的全新评测基准和训练方法
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
至顶网
科技行者 2025-07-18 16:07:11
剥开“洋葱模型”,细数云上安全合规机制构筑始末
本文将对亚马逊云科技构建的云上安全堡垒一窥全貌,进而解构其提出的三大安全理念,以飨读者。
至顶网
至顶网云计算频道 2022-04-27 14:27:23
香港中大突破视频编辑难题:让你轻松掌控每一帧画面的神奇技术
这项来自香港中文大学的研究开发了名为"LoRA-Edit"的视频编辑技术,通过巧妙结合LoRA适应技术和遮罩机制,解决了传统视频编辑中编辑效果难以精确传播、背景容易被意外改变的问题。该技术让用户只需编辑第一帧画面,就能让编辑效果自然传播到整个视频,同时可通过参考图片进一步控制编辑外观,在多项对比测试中均超越现有先进方法。
至顶网
科技行者 2025-06-19 12:54:25
香港中文大学团队让AI成为卡通制作神器:一张图加几笔线稿就能生成完整动画片
香港中文大学等机构联合研发的ToonComposer系统实现了动画制作的重大突破,仅需一张彩色图片和几张线稿草图即可自动生成完整卡通动画。该系统通过稀疏草图注入机制和空间低秩适配器技术,将传统的中间帧绘制和上色工作整合为统一的"后关键帧制作"阶段,大幅提升制作效率。实验显示其在视觉质量和动作连贯性等指标上显著超越现有方法,为动画产业的智能化发展开辟新路径。
至顶网
科技行者 2025-08-19 10:46:28
加州大学圣克鲁兹分校发布革命性图像编辑数据集:让开源AI模型首次逼近GPT-4o的专业水准
加州大学圣克鲁兹分校研究团队创建了包含150万高质量样本的GPT-IMAGE-EDIT-1.5M图像编辑数据集,通过利用GPT-4o优化现有数据质量,使开源AI模型在多项测试中达到接近GPT-4o的性能水平,在GEdit-EN测试中获得7.24分的突破性成绩,显著缩小了开源与商业模型的差距,为AI图像编辑技术的民主化奠定了基础。
至顶网
科技行者 2025-08-04 13:35:21
《数字经济洞察周报》2023年第22期 |第十四届夏季达沃斯论坛在天津召开
2023年新领军者年会在天津召开
至顶网
孙硕,吕敬儒 2023-06-30 17:11:13
IBM THINK演讲实录 | IBM总裁Jim Whitehurst:利用混合云加速规模创新
Jim Whitehurst于IBM Think Digital 大会上的主题演讲全文。
至顶网
至顶网云计算频道 2020-05-12 14:34:54
一文读懂华为云开年采购季爆款协同办公产品,开启云上办公新体验
2024年华为云开年采购季期间,博主将对华为云桌面、华为云会议两款协同办公类产品进行实测,一起详细看看它们能为中小企业带来哪些数字办公新体验吧。
至顶网
业界供稿 2024-03-20 14:02:52
斯坦福大学重磅发现:为什么有些AI能越来越聪明,有些却停滞不前?
斯坦福大学研究团队通过对比实验发现,AI模型自我改进能力的关键在于四种认知行为:验证、回溯、子目标设置和逆向推理。具备这些"思维习惯"的模型能有效利用额外计算时间提升表现,而缺乏认知行为的模型则停滞不前。研究证明通过精心设计的训练数据可以人为培养这些能力,且思维过程比正确答案更重要。这一发现为AI发展指出新方向:培养正确思维方式比增加数据量更关键。
至顶网
科技行者 2025-07-30 20:49:35
新南威尔士大学首创ZARA:让AI像侦探一样从运动传感器数据中识别人类活动
新南威尔士大学研究团队开发了ZARA系统,这是首个零样本运动识别框架,能够在未经专门训练的情况下识别全新的人类活动。该系统集成了自动构建的知识库、多传感器检索机制和分层智能体推理,不仅实现了比现有最强基线高2.53倍的识别准确率,还提供清晰的自然语言解释,为可穿戴设备和健康监护等应用领域带来了突破性进展。
至顶网
科技行者 2025-08-27 15:22:41
创业者涌入AI战场,最先利用AI大模型赚到钱的人
AIGC淘金人。
至顶网
吴彤 2024-07-18 14:40:10
ByteDance Seed研究团队发布BAGEL:探索统一多模态预训练中的涌现能力
ByteDance Seed团队发布的BAGEL是一个突破性开源基础模型,采用混合变换器专家架构,能同时执行多模态理解和生成任务。研究显示,随着训练数据和模型规模增加,BAGEL展现"涌现能力"—从基础理解和生成,到复杂编辑和自由形式视觉操作,再到长上下文推理,呈现能力阶梯式提升。模型在标准基准测试中超越现有开源统一模型,并显示出强大的世界建模能力,如世界导航和视频生成。研究团队开源了代码和模型检查点,为多模态AI研究开辟新方向。
至顶网
科技行者 2025-05-26 08:20:53
当AI学会倾听人类情感:LAION团队打造史上最精细的语音情感识别基准测试
LAION团队联合多个顶尖研究机构推出EMONET-VOICE语音情感识别基准,包含4500小时多语言合成语音数据和40种精细情感分类。该项目通过心理学专家标注创建高质量测试集,开发出性能领先的EMPATHICINSIGHT-VOICE模型,发现AI系统对高唤醒度情感识别效果好但低唤醒度情感识别困难,为语音AI向人性化发展奠定重要基础。
至顶网
科技行者 2025-06-25 11:36:17
华为团队重大突破:让AI直接理解数学题并给出严格证明,就像有了一个永不出错的数学助手
华为诺亚方舟实验室联合香港中文大学团队在2025年6月首次实现了从自然语言数学问题到严格证明的端到端自动化处理。他们开发的Mathesis系统包含创新的强化学习自动形式化器、精细化评估框架LeanScorer,以及高性能证明器,在中国高考数学测试集上达到18%成功率,相比最佳基线提升22%。该系统已集成到华为Celia智能助手中,将数学问题解决准确率从65.3%提升至84.2%,展现了AI数学推理的巨大应用潜力。
至顶网
科技行者 2025-06-16 09:57:21
AlphaGo对局李世石两周年纪:AI程序攻克围棋的算法秘密
我们将详细介绍AlphaGo是什么以及它的工作原理。
至顶网
科技行者 2018-03-16 20:34:04
字节跳动AI团队推出UNO:图像"魔法师"实现从一到多主题的自由创作
字节跳动AI团队推出的UNO系统实现了图像生成领域的重要突破,能够根据参考图片生成新场景,并首次很好地解决了多主题图像生成的技术难题。该系统采用创新的渐进式训练策略和自动化数据生成技术,在保持参考物体特征的同时实现了灵活的场景创作,为创意产业提供了强大的AI辅助工具。
至顶网
科技行者 2025-07-14 09:48:45
MIT实验室打造音频界"翻译官":一个模型搞定语音、音乐和环境声
这篇论文介绍了MIT开发的USAD技术,这是一种能够同时理解语音、音乐和环境声音的通用音频AI模型。通过创新的知识蒸馏方法,USAD在多个音频处理任务上都达到了接近专门模型的性能水平,为构建更智能的音频理解系统奠定了基础。该技术在智能助手、多媒体处理、教育等领域具有广阔的应用前景。
至顶网
科技行者 2025-06-27 16:59:36
网易有道团队发布Confucius3-Math:让消费级GPU也能跑出顶级数学推理能力的14B参数模型
网易有道研究团队开发了Confucius3-Math,这是一个专门针对中国K-12数学教育的14B参数AI模型。该模型在多项数学推理测试中表现出色,超越了许多规模更大的竞争对手,训练成本仅需2.6万美元,推理速度比DeepSeek-R1快15倍,能在消费级GPU上高效运行,旨在通过降低AI教育成本来促进教育公平。
至顶网
科技行者 2025-07-02 09:09:50
<
上一页
276
277
278
279
280
281
282
283
284
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号