搜一下
用了 0.045737秒,为您找到
奔驰
宝马
游戏
网站
bcbm
網纸
YB233
相关内容3937 条
让AI真正"看懂"并编辑图片:上海交大团队开创视觉推理新基准
上海交大团队首次建立AI视觉推理评估标准RISEBench,测试发现即使最先进的GPT-4o-Image在推理驱动的图像编辑任务中准确率仅28.8%。研究涵盖时间、因果、空间、逻辑四大推理维度,揭示当前AI缺乏真正理解物理规律和逻辑关系的能力,为AI发展指明了从模式识别向深层推理转变的重要方向。
至顶网
科技行者 2025-07-16 09:17:45
我如何从三本到顶级金融外企
「 老易说:“如果你羡慕大佬,那你自己就变成大佬。对抗恐惧最好的办法就是直面恐惧,就这么简单。”」
至顶网
尼酱 2023-02-03 10:22:02
AI语言模型遇到"混淆问题"时为何表现不佳?印度理工学院等联合研究揭示大模型推理盲区
印度理工学院等机构研究发现,即使是最先进的AI模型如GPT-4o、Claude等,在面对间接表达、干扰信息或背景过载的"混淆问题"时,准确率会从70-80%骤降至25-40%。研究团队开发的ObfusQAte评估框架首次系统性揭示了大语言模型的这一重要缺陷,为改进AI推理能力和提高实际应用可靠性提供了重要基准。
至顶网
科技行者 2025-08-18 13:59:16
阿里通义团队让AI学会"读心术"——HumanOmniV2如何让机器真正懂人心
阿里巴巴通义实验室的研究团队开发了HumanOmniV2,这是一个能够真正"读懂"人类复杂意图和情感的AI系统。该系统通过改进强化学习方法,让AI在回答问题前必须先全面理解多模态背景信息,解决了现有AI模型忽略重要线索和缺乏全局理解的问题,在多项测试中表现优异。
至顶网
科技行者 2025-07-03 13:59:35
深度评测:“算力猛兽”浪潮NF5468A5 GPU服务器
我们引用了该篇评测报告,详细原文如下。同时,浪潮当前也推出了NF5468A5“超值机型 限免试用”活动,对该GPU服务器感兴趣的不妨一试。
至顶网
业界供稿 2022-07-13 15:27:47
炼金术士:颠覆性方法让公开文生图数据变黄金 - 仅3350个样本实现突破性提升
Alchemist是一项由Yandex研究团队开发的创新方法,能将公开文生图数据转化为高效微调资源。研究者利用预训练扩散模型作为数据质量评估器,从海量图像中精选出仅3,350个高价值样本创建数据集。实验表明,这个紧凑数据集能显著提升五种Stable Diffusion模型的生成美学质量和图像复杂度,同时保持风格多样性。研究不仅开源了数据集,还公开了微调模型权重,为AI社区提供了替代专有微调管道的开放解决方案。
至顶网
科技行者 2025-05-30 10:05:43
UNC研究团队推出Bifrost-1:用"补丁级CLIP"让AI既能看又能画,训练成本骤降90%!
北卡大学研究团队推出Bifrost-1系统,通过创新的"补丁级CLIP潜在变量"技术,成功让多模态大语言模型和扩散模型高效协作,实现了既能理解又能创作图像的AI助手。该方法避免了传统技术的高成本训练问题,在保持原有理解能力的同时,以90%的成本降幅实现了与顶级方法相当的图像生成质量,为多模态AI发展提供了全新的"桥接"思路。
至顶网
科技行者 2025-08-14 12:44:32
放开那个艺术家!Glaze保护艺术免受AI窥探
生成式AI对艺术风格的疯狂模仿,应当休矣。
至顶网
TechCrunch 2023-03-24 16:13:19
香港科技大学重磅发布Audio-FLAN:全球首个音频版"GPT",让AI既能听又能创造
香港科技大学研究团队发布了Audio-FLAN,这是全球首个大规模音频指令训练数据集。该数据集涵盖语音、音乐、声音三大领域的80个任务,包含超过1亿个训练样本,首次实现了音频领域的统一指令学习。通过类似ChatGPT的训练方法,Audio-FLAN能够训练出既能理解又能生成音频的通用AI模型,有望推动音频人工智能从专业化工具向通用助手的转变。
至顶网
科技行者 2025-08-20 18:06:21
黄仁宇的理想国和AI驱动的未来企业
从万物连接到万物智能,组织中的数据洪流让数目字管理变成不再遥不可及,让黄仁宇的“理想国”在技术上成为可能,我们对此做好准备了么?
至顶网
高飞、周雅 2018-11-09 16:27:57
南洋理工与得州农工团队重磅合作:打破4D空间重建瓶颈,为虚拟世界构建全新智能系统
新加坡南洋理工大学联合国际团队首次提出4D空间智能重建的五层级分类体系,从基础空间感知到物理规律融合,为从视频构建三维动态世界技术发展提供完整路线图,有望革命性改变虚拟现实、机器人和数字内容创作领域。
至顶网
科技行者 2025-08-05 10:33:35
没有空间智能,AI一定是不完整的,李飞飞最新访谈:语言在自然世界中并不存在,世界模型将让人类在多元宇宙中生活
李飞飞的World Labs以"空间智能"重新定义AI,专注3D物理世界理解,4个月估值飙至10亿美元,获科技巨头集体押注。她揭示语言无法编码物理世界,而DNA双螺旋等突破性发现都源于三维空间的深度认知。
至顶网
至顶AI实验室 2025-06-09 16:32:40
我在MWC上海,看到5G-A和AI的融合开始具像化了
我们每个人,都将是这场价值革命的亲历者和受益者。
至顶网
周雅 2025-06-21 14:22:08
我在MWC上海,看到5G-A和AI的融合开始具像化了
我们每个人,都将是这场价值革命的亲历者和受益者。
至顶网
周雅 2025-06-21 14:25:28
SonicMaster:新加坡科技设计大学团队让破音音乐起死回生的神奇技术
新加坡科技设计大学研究团队开发出SonicMaster,这是首个支持自然语言控制的统一音频修复系统。该系统能够同时处理音乐录制中的19种常见问题,包括混响、削波、频响不平衡等,用户只需用普通话描述需求即可获得专业级处理效果。研究团队构建了包含17.5万音频样本的训练数据集,测试显示系统在客观指标和主观听感上均显著优于传统方法,为音频处理技术的普及应用提供了新思路。
至顶网
科技行者 2025-08-08 13:06:28
Google I/O一次性更新N个产品,不止Gemini要成世界模型,连智能眼镜都强势回归!
太平洋时间5月20日上午,在加州山景城海岸线圆形剧场(Shoreline Amphitheatre),空气中弥漫着咖啡香气和一种几乎能触摸到电子脉冲般的兴奋感,2025 Google I/O(谷歌开发者大会)开始了,而此时的我们,正处于这股AI浪潮的中心。
至顶网
周雅 2025-05-22 15:57:25
清华大学和新加坡技术设计大学联合研究:AI不用学习样本也能写出万字长文,强化学习让机器从零开始掌握写作
清华大学和新加坡技术设计大学联合发布了突破性AI写作研究LongWriter-Zero,该模型完全通过强化学习训练,无需任何长文样本即可生成万字高质量文章。实验显示,仅32B参数的LongWriter-Zero在WritingBench和Arena-Write基准测试中均超越了千亿参数级的顶级模型,证明了创新训练方法胜过单纯扩大模型规模的理念。
至顶网
科技行者 2025-06-26 19:51:12
电影导演的神器来了!大连理工团队打造CineMaster,让普通人也能像专业导演一样精准控制AI视频生成
CineMaster是由大连理工大学等机构联合开发的突破性视频生成框架,首次实现了电影级别的三维空间精确控制。用户可在三维环境中自由摆放物体、设计摄像机运动,系统自动生成符合预期的高质量视频。该技术通过创新的数据标注流水线和分阶段训练策略,在物体定位精度和运动控制准确性方面显著超越现有方法,为可控视频生成领域树立了新标杆,有望推动创意产业的民主化发展。
至顶网
科技行者 2025-08-21 16:40:09
黄仁勋北京媒体会:如何用十个AI方法论改变世界?
黄仁勋于昨天(7月16日)参加了在北京举行的第三届链博会,并于下午举行了长达90分钟的记者会。
至顶网
至顶AI实验室 2025-07-17 08:35:46
MWC 2023,华为5G商业方法论和完备的产品解决方案已形成!
基于对用户体验与商业发展的深入洞察,呼吁行业携手努力,立足5G商业再想象(Reimagine)、5G网络再出发(Reinforce)、5G技术再创造(Reinvent),让5G从成功走向更大的成功。
至顶网
任新勃 2023-02-28 10:21:14
<
上一页
189
190
191
192
193
194
195
196
197
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号