搜一下
用了 0.032991秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容2143 条
MOLE:利用大语言模型从科学论文中提取和验证元数据的创新框架
MOLE是一个由KAUST研究团队开发的创新框架,利用大语言模型从科学论文中自动提取数据集元数据。与传统方法相比,MOLE能提取30多种不同元数据属性,支持多语言数据集,并提供严格的验证机制确保输出质量。研究测试了包括Gemini、GPT-4o等七种大模型,结果显示Gemini 2.5 Pro整体表现最佳。MOLE通过自动化元数据提取,使研究人员能更容易发现和使用适合的数据集,促进研究效率和科学开放性。
至顶网
科技行者 2025-05-30 09:42:55
Meta首次突破:AI注意力机制终于学会"一心多用",让计算机能同时关注多个线索
Meta公司FAIR实验室的研究团队提出了多令牌注意力机制,这是一种突破性的AI注意力计算方法。通过引入卷积操作,新机制让AI能够同时关注文本中的多个位置并协调整合信息,解决了传统注意力机制"一心一用"的根本局限。在大规模语言模型和长文本任务中,该技术显著提升了AI的信息检索和理解能力。
至顶网
科技行者 2025-07-15 11:34:47
复旦大学联合团队发布GeometryZero:让小尺寸AI模型也能像数学天才一样解决几何难题
复旦大学联合多所知名院校开发了GeometryZero模型,通过创新的群体对比策略优化(GCPO)方法,让小尺寸AI模型具备了类似数学专家的几何推理能力。该模型能智能判断何时使用辅助构造工具,在多个几何基准测试中表现优异,为AI教育应用的普及化奠定了基础,展现了专门化训练的巨大潜力。
至顶网
科技行者 2025-06-12 09:55:13
探寻魔都“引力场”:AI创新者为何在这片土地集体找到归属感?
这两家公司,一个是向内拷问人性的AI先锋,一个是向外探索物理极限的AI长跑者,却都将事业锚点,落在漕河泾开发区时,一个题目浮现了:这片土地的科创引力从何而来?
至顶网
周雅 2025-07-24 16:29:03
华威大学突破:首个教育对话中"有趣度"预测模型,AI终于懂得如何让学习更吸引人
华威大学研究团队首次创建了教育对话"有趣度"预测数据集IntrEx,通过100多名二语学习者标注5801个对话片段,发现经专门训练的小型AI模型在预测学习兴趣方面超越GPT-4。研究揭示对话需要"适度挑战"和新颖性平衡才能最大化吸引力,为个性化教育和智能教学系统开发提供了科学基础,标志着教育吸引力评估从主观判断向科学测量的重要转变。
至顶网
科技行者 2025-09-26 12:13:39
深度学习也能像人一样"看重点"?揭秘视觉AI如何学会聪明地观察世界
这项研究提出了"高效探测"方法,解决了掩码图像建模AI难以有效评估的问题。通过创新的多查询交叉注意力机制,该方法在减少90%参数的同时实现10倍速度提升,在七个基准测试中均超越传统方法。研究还发现注意力质量与分类性能的强相关性,生成可解释的注意力图谱,展现出优异的跨域适应性。团队承诺开源全部代码,推动技术普及应用。
至顶网
科技行者 2025-06-18 13:07:41
亚马逊研究团队推出BeepBank-500:让电子音效研究变得像搭积木一样简单
亚马逊首席科学家Mandip Goswami发布BeepBank-500开源数据集,包含300-500个参数化合成电子音效,专为听觉界面研究设计。该数据集提供完整的元数据标注、可重现的生成脚本和基准测试,音频采用CC0-1.0许可证完全开放,填补了电子音效研究领域缺乏标准化工具的空白,为心理声学和人机交互研究提供了便捷的实验材料。
至顶网
科技行者 2025-10-13 09:02:05
计算机视觉新突破:斯坦福大学让视频生成模型学会"追踪"物体运动
斯坦福大学研究团队开发了KL-tracing方法,能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记,利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中,相比传统方法性能提升16.6%,展现了大型生成模型在计算机视觉任务中的潜力。
至顶网
科技行者 2025-07-22 13:23:34
清华大学和智谱AI联手打造355B参数超级AI大脑:GLM-4.5如何在推理、编程和智能代理三个关键领域同时称王
清华大学和智谱AI联合发布GLM-4.5系列模型,这是首个在推理、编程和智能代理三大核心领域同时达到顶尖水平的开源AI模型。GLM-4.5拥有355B参数但仅激活32B,创新的混合推理模式能根据任务复杂度自动选择思考深度。该模型在12项基准测试中排名第三,智能代理任务排名第二,已完全开源供研究使用。
至顶网
科技行者 2025-08-13 10:57:51
把家里老设备组装成超级计算机:阿联酋研究团队让70B大模型在普通家庭设备上飞速运行
阿联酋和中国研究团队联合开发prima.cpp系统,成功实现70B大模型在普通家庭设备集群上运行。该系统通过创新的管道环形并行技术和Halda调度算法,将响应速度提升15倍至600毫秒,内存压力控制在6%以下,为AI技术民主化提供了新路径。
至顶网
科技行者 2025-07-17 09:28:40
伊利诺伊大学团队突破手机视频重建难题:不需要额外传感器,仅凭摄像头就能完美还原动态场景
伊利诺伊大学团队开发出ROS-Cam系统,仅需普通RGB视频即可精确重建动态三维场景,无需激光雷达等额外传感器。该技术通过补丁式追踪过滤器、异常值感知优化和两阶段策略,在多个数据集上超越现有方法,处理速度提升2-12倍。这项突破有望让普通用户轻松创建专业级三维内容,在电商、教育、文化保护等领域具有广阔应用前景。
至顶网
科技行者 2025-10-09 12:20:08
InfiX.ai发布InfiAlign:用12%训练数据追平顶级AI模型,让机器"小体量大智慧"的数据精选秘籍
InfiX.ai和香港理工大学联合发布的InfiAlign框架,通过多维数据筛选和两阶段课程学习,仅用12%训练数据就达到顶级模型性能。该框架发现回答长度与问题难度正相关,创新性地用长度作为难度指标,结合多样性采样和质量过滤,实现了数据效率的巨大提升。在数学推理等任务中表现优异,为资源有限的机构提供了经济高效的AI模型训练方案。
至顶网
科技行者 2025-08-13 09:23:43
重庆大学团队让AI像病理专家一样聚焦关键信息:突破传统方法的"偷懒"问题
重庆大学团队提出MHIM-MIL框架,通过"屏蔽困难实例挖掘"策略解决传统医学AI过度依赖简单特征的问题。该方法采用"老师-学生"协作机制,强制AI学习困难病例,在癌症诊断等多个医学任务中显著超越现有方法,同时大幅提升计算效率,为医学AI实际应用提供重要突破。
至顶网
科技行者 2025-09-28 13:47:57
从视频学会折纸?ByteDance团队让AI首次通过看视频掌握复杂技能
这项由ByteDance Seed和北京交通大学联合完成的研究首次让AI真正学会从真实世界视频中掌握复杂长时技能。研究团队开发的VideoWorld 2系统通过创新的dLDM技术架构,成功分离了动作学习和外观建模,使AI能够像人类一样从观察中学习并在新环境中准确复现技能。在手工制作和机器人操作任务中,该系统展现了显著的性能提升和强大的跨域泛化能力,为构建更通用的AI学习系统开辟了新路径。
至顶网
科技行者 2026-02-11 15:58:40
微软沙特阿拉伯研究团队发布Kuwain 1.5B:用"语言注射"技术让英文AI秒懂阿拉伯语
沙特阿拉伯misraj.ai团队开发了Kuwain 1.5B,一个仅15亿参数的阿拉伯语-英语双语AI模型。他们创新性地提出"语言注射"技术,在英语模型基础上增加8个新层专门处理阿拉伯语,同时保持原有层冻结。通过扩展26000个阿拉伯语词汇和9:1的数据配比,实现了阿拉伯语性能8%提升,英语能力完全保持,训练成本降低70%。该方法可推广到其他语言,为多语言AI发展提供了高效经济的新路径。
至顶网
科技行者 2025-07-17 09:27:01
北京科学院联合字节跳动重磅发布:让AI真正"看懂图片思考"的全新评测基准和训练方法
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
至顶网
科技行者 2025-07-18 16:07:11
《数字经济洞察周报》2023年第22期 |第十四届夏季达沃斯论坛在天津召开
2023年新领军者年会在天津召开
至顶网
孙硕,吕敬儒 2023-06-30 17:11:13
台湾大学联合MediaTek和Nvidia突破性成果:让AI自己教自己说话识别,语音识别准确率提升55%
台湾大学联合MediaTek和Nvidia的研究团队开发了一种突破性的语音识别自我改进框架,无需大量人工标注数据即可显著提升AI语音识别准确率。该方法通过让AI生成伪标签训练语音合成系统,再用合成语音反向训练识别模型,形成自我强化循环。在台湾国语测试中,新模型Twister比原版Whisper错误率降低20-55%,数据效率提升10倍以上,为低资源语言AI应用提供了新路径。
至顶网
科技行者 2025-06-19 10:47:53
复旦大学团队突破多模态AI理解瓶颈:让机器像人一样"看懂"图片不再靠猜测
复旦大学等机构联合提出ASVR方法,通过自回归语义视觉重构解决大型视觉语言模型过度依赖文字监督的问题。该方法让AI同时学习视觉和文本信息,在14个多模态理解基准上平均提升5个百分点。研究发现语义重构比像素重构更有效,且方法在不同架构、数据规模和分辨率下均表现稳健,为AI视觉理解能力提供了新的技术路径。
至顶网
科技行者 2025-06-16 10:57:34
对话Rokid赵维奇:AR为什么是探索现实世界“副本”的最佳形态
作为中美连续创业者,赵维奇的创业之路非常宽泛,做过社交软件、做过游戏、做过面向极限运动的AR产品等。而现在,赵维奇作为Rokid全球开发者生态负责人,也参与负责Rokid多款软硬件产品设计与研发。他回忆说,最早加入Rokid是在实验室,开发Rokid第一代AR眼镜,相当于是一个小组在做内部创业的过程。
至顶网
周雅 2024-09-09 15:22:53
<
上一页
99
100
101
102
103
104
105
106
107
108
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号