搜一下
用了 0.212838秒,为您找到
mg
娱乐
公司
什么
網纸
YB233
相关内容20983 条
浙江大学发布LAPO:让AI学会"适度思考"的智能训练方法
浙江大学团队开发的LAPO方法成功解决了AI推理模型"过度思考"问题,通过两阶段训练让AI学会根据问题复杂度自主调整推理深度。实验显示该方法将计算用量减少40.9%的同时准确率提升2.3%,为AI系统的智能化和实用化发展提供了重要突破。
至顶网
科技行者 2025-07-29 10:04:28
UC默塞德等高校联合推出Sa2VA:让AI同时看懂图像和视频的智能助手
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。
至顶网
科技行者 2025-09-16 11:09:55
斯坦福大学、Meta和密歇根大学联合揭晓:流媒体视频里的AI助手能边看边聊,还会主动出招帮你完成任务
这项由斯坦福大学、Meta
公司
和密歇根大学联合完成的研究,开发了能够实时观看视频并主动提供任务指导的AI助手系统。研究团队创建了包含30万对话的PROASSIST数据集,设计了创新的评估方法,并开发了能处理流媒体视频的端到端模型。实验显示,该系统能够在烹饪、组装等多种任务中提供及时准确的指导,为开发真正智能的人工助手奠定了基础。
至顶网
科技行者 2025-06-13 08:02:35
让机器人也能"理解"世界:北大团队打造会思考的通用机械手
这项由北大团队开发的OmniManip系统,通过创新的物体中心表示方法和双重闭环控制,让机器人能够理解自然语言指令并在复杂环境中精确操作。系统在12项真实任务测试中达到68.3%成功率,远超传统方法,展现了从服务机器人到工业制造等广泛应用前景。该技术为实现真正智能的通用机器人奠定了重要基础。
至顶网
科技行者 2025-09-17 13:29:46
北航大学团队推出Easy Dataset:让普通人也能制作AI训练数据的神奇工具
北航团队推出Easy Dataset框架,通过直观的图形界面和角色驱动的生成方法,让普通用户能够轻松将各种格式文档转换为高质量的AI训练数据。该工具集成了智能文档解析、混合分块策略和个性化问答生成功能,在金融领域实验中显著提升了AI模型的专业表现,同时保持通用能力。项目已开源并获得超过9000颗GitHub星标。
至顶网
科技行者 2025-07-16 10:01:52
首尔国大突破图表理解难题:AI再也不会"胡编乱造"图表描述了
首尔国立大学研究团队开发了CHARTCAP数据集,包含56.5万个高质量图表-描述对,通过四阶段流水线和循环验证方法解决了AI图表理解中的幻觉和信息贫乏问题。研究还提出了视觉一致性得分评估方法,该方法通过重构图表来验证描述质量。实验显示,经CHARTCAP训练的AI模型在图表理解能力上首次超越人类专家标注,为AI在专业领域的应用开辟新路径。
至顶网
科技行者 2025-08-08 11:54:42
量子机器学习的新突破:爱尔兰都柏林大学团队发现Vision Transformer嵌入让量子计算机在图像识别上首次超越经典算法
爱尔兰都柏林大学研究团队发现了量子机器学习的重要突破:通过Vision Transformer嵌入,量子支持向量机首次在图像识别任务上显著超越传统算法,在Fashion-MNIST上提升8.02%准确率。研究揭示量子优势关键在于选择合适的数据表示方法,而非单纯依赖量子算法。
至顶网
科技行者 2025-08-07 14:18:42
加速音频生成的突破:让AI音频创作从几分钟缩短到几毫秒——来自加州大学圣地亚哥分校和Stability AI的最新研究成果
加州大学圣地亚哥分校和Stability AI联合研究团队提出了革命性的ARC音频生成加速方法,将AI音频生成时间从几分钟缩短到几十毫秒,实现100倍速度提升。该方法通过对抗性相对论-对比训练让AI学会"一步到位"生成高质量音频,不仅保持了音频质量,还显著提升了生成多样性。技术已可在智能手机上运行,为音频创作、游戏开发和内容制作等领域带来实时化的创意工具。
至顶网
科技行者 2025-07-09 11:58:19
阿里云Flink+Hologres:构建企业级一站式实时数仓
随着大数据的迅猛发展,企业越来越重视数据的价值,这就意味着需要数据尽快到达企业分析决策人员,以最大化发挥数据价值。
至顶网
业界供稿 2022-08-25 15:31:10
地平线机器人:让AI世界触手可及的3D世界生成引擎,机器人终于能在真实感虚拟世界中学习了
地平线机器人等机构联合发布EmbodiedGen——首个面向机器人智能的交互式3D世界生成平台。该系统能从单张图片或文字描述生成具备真实物理属性的3D资产,包括刚体物体、关节物体和完整场景,支持纹理编辑与多样化背景生成。所有资产采用URDF格式,可直接导入主流物理仿真器进行机器人训练。通过自动化质量检测、物理属性恢复等创新技术,EmbodiedGen实现了从真实世界到虚拟仿真的无缝转换,为机器人智能研究提供了低成本、高质量的数据增强解决方案。
至顶网
科技行者 2025-06-18 17:44:14
AI学会"分区管理"思维:特拉维夫大学突破语言模型内部理解新方法
特拉维夫大学研究团队提出用"混合因子分析"方法重新理解AI语言模型的内部机制,发现AI思维呈现社区化结构而非简单线性排列。这种新方法将AI的激活空间分解为语义相关的区域中心和局部变化方向,在概念定位和行为控制任务上显著优于传统方法,为精确控制AI、个性化应用和提升AI可解释性开辟了新路径。
至顶网
科技行者 2026-02-12 13:33:11
AI也能看图学本事了!南开大学团队让机器像人一样举一反三
南开大学团队开发的VisualCloze系统通过"视觉上下文学习"实现了通用图像生成,让AI能够像人类一样通过观察几个例子就学会新的图像处理任务。该系统采用统一架构处理多种任务,在风格转换、图像编辑、条件生成等方面都表现出色,并具备处理训练时未见过任务的泛化能力。
至顶网
科技行者 2025-07-15 10:10:06
如何让AI更聪明地理解多种语言?法国、葡萄牙等欧洲研究机构联合发布语言AI突破性成果
这项由法国CentraleSupélec大学领导的国际研究成果发布了EuroBERT多语言AI模型家族,该模型支持15种语言处理,具备数学和编程理解能力,支持长达8192token的文本处理,在多项任务上超越现有模型,为跨语言AI应用提供了新的技术基础。
至顶网
科技行者 2025-08-04 09:58:02
布尔诺工业大学团队突破语音识别瓶颈:让机器更准确理解人类话语的新方法
布尔诺工业大学研究团队开发了DeCRED方法,通过在语音识别系统解码器中添加辅助监督,显著提升了系统在未知领域的泛化能力。该方法将域外测试错误率从18.2%降至16.2%,仅用1.72亿参数就达到了接近大型模型的性能。
至顶网
科技行者 2025-08-15 08:29:33
新加坡国立大学发现AI写作新模式:离散扩散如何让机器像人一样"修改文章"
新加坡国立大学研究团队发布了离散扩散大语言模型的全面综述,这种新型AI写作模式让机器能像人类一样反复修改文本,而非传统的从左到右逐字生成。技术实现了10倍推理加速,支持精确的格式控制和并行生成,在保持传统模型性能的同时,解决了可控性和推理效率问题。
至顶网
科技行者 2025-06-20 10:27:27
斯坦福大学发布BIOMEDICA:从2400万张医学图片中诞生的AI医生助手
斯坦福大学研究团队构建了包含2400万医学图像的BIOMEDICA数据库,并开发出性能卓越的BMC-CLIP医学AI模型。该项目通过从600万篇科学文献中提取图像和文字,创建了医学领域最大的开放数据集,在40项医学任务测试中平均性能提升6.56%,计算效率提高10倍,为医学AI发展提供了重要基础资源。
至顶网
科技行者 2025-09-17 13:31:12
约翰霍普金斯大学震撼发现:AI界的"双胞胎实验"揭示语言模型的真正奥秘
约翰霍普金斯大学研究团队开发了ETTIN模型套件,首次实现了编码器和解码器模型的公平比较。研究发现编码器擅长理解任务,解码器擅长生成任务,跨界训练效果有限。该研究为AI模型选择提供了科学依据,所有资料已开源供学术界使用。
至顶网
科技行者 2025-07-23 10:54:47
从真实到合成:如何让AI批量制造出千万条复杂又多样的用户指令——中科大和Metastone
公司
的突破性研究
中科大与Metastone
公司
合作提出"归因接地"框架,通过分析真实指令的产生机制来大规模合成高质量训练数据。该方法将指令归因于文档、用户和动机三要素,构建了100万条指令的SynthQuestions数据集。实验显示,用该数据集训练的AI模型性能显著提升,证明了质量胜过数量的重要性,为解决AI训练数据稀缺问题提供了新思路。
至顶网
科技行者 2025-06-20 09:27:59
让大模型下棋:人工智能在外交游戏中的惊人表现——Good Start Labs与独立研究者的突破性发现
Good Start Labs与多位独立研究者合作开发了首个让任意大语言模型无需训练即可玩完整外交游戏的评估框架。通过优化文本化游戏状态表示,240亿参数模型就能可靠完成比赛。研究发现模型会自然展现承诺、背叛、联盟等复杂策略行为,且不同模型表现出独特的"外交性格"。该框架大幅降低了AI战略推理研究门槛,为理解语言模型的策略能力提供了新途径。
至顶网
科技行者 2025-08-15 09:06:32
安全与可信的智能代理时代:向量研究所发布LLM多智能体系统信任、风险与安全管理全面综述
这份来自向量研究所、康奈尔大学和格罗宁根大学研究团队的综述分析了基于大语言模型的代理型多智能体系统中的信任、风险和安全管理框架(TRiSM)。研究系统地探讨了代理型AI从概念基础到安全挑战,提出了包含治理、可解释性、模型运营和隐私/安全四大支柱的TRiSM框架。文章还详细分析了威胁向量、风险分类,并通过真实案例研究展示了潜在脆弱性。
至顶网
科技行者 2025-06-07 15:59:45
<
上一页
1039
1040
1041
1042
1043
1044
1045
1046
1047
1048
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号