用了 0.052896秒,为您找到信誉 最好 靠谱 大发 平台 罔芷 88pkee 驻测相关内容3710 条
  • 全能模型的困境:为什么让AI什么都会可能适得其反?

    这项来自加州大学戴维斯分校和俄亥俄州立大学的研究探讨了多模态AI训练的一个重要问题:让AI同时学会处理文字、图像、视频等多种信息类型时,是否会影响其原有的语言能力?研究发现,扩展模态确实存在能力权衡,模型合并技术比全模态同步训练更有效,为AI发展提供了重要启示。
    至顶网  科技行者  2025-06-10 11:38:31  
  • Meta开源世界模型V-JEPA 2:能看懂视频、预测未来、控制机器人的超级AI

    Meta开源世界模型V-JEPA 2:能看懂视频、预测未来、控制机器人的超级AI
    至顶网  至顶AI实验室  2025-06-16 17:03:47  
  • 亚马逊首席技术官预测2021:八大技术趋势改变世界

    2020年12月18日,在为期三周的亚马逊re:Invent全球大会即将闭幕之际,亚马逊全球副总裁、首席技术官Werner Vogels博士发表压轴演讲,分享了他对2021年的科技趋势的预测。
    至顶网  至顶网CIO与CTO频道  2020-12-22 10:13:51  
  • 印度理工学院发布史上最大规模印度文化AI测试:15种语言64000题,揭示AI的文化盲区

    印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。
    至顶网  科技行者  2025-10-14 12:11:56  
  • 让AI学会"团队协作":伊利诺伊大学团队开发出让多个AI模型协同工作的智能调度系统

    伊利诺伊大学香槟分校研究团队开发了Router-R1,一个能让多个AI模型像团队一样协作的智能调度系统。该系统通过强化学习,学会在"思考"和"调用专家"之间灵活切换,能根据任务复杂度动态协调不同AI模型,同时平衡性能与成本。在七个问答数据集的测试中,Router-R1显著超越现有方法,平均准确率提升约20%,并展现出对未见过模型的强泛化能力。
    至顶网  科技行者  2025-06-24 13:46:54  
  • zELO训练法:让AI排序更懂人心的新方法

    ZeroEntropy团队提出zELO训练方法,借鉴象棋ELO评分系统,通过AI模型两两比较文档相关性来训练重排序器。该方法避免了传统人工标注的高成本问题,训练出的zerank模型在多个领域测试中显著超越商业竞争对手,同时开源了模型权重和训练工具,为AI搜索技术发展提供了新的训练范式。
    至顶网  科技行者  2025-09-29 14:28:46  
  • AI终于学会了"看声音":Captions公司让机器理解语音背后的表情和手势

    Mirage向我们展示了一个令人兴奋的未来——一个AI不仅能理解我们说什么,还能理解我们如何说的世界。在这个世界里,技术不再是冰冷的工具,而是能够理解和模拟人类情感表达的智能伙伴。
    至顶网  至顶AI实验室  2025-06-12 17:57:09  
  • 大语言模型为什么总是"学会"错误的东西?浙江大学研究团队找到了让AI更聪明的全新方法

    浙江大学研究团队开发了CAT方法,通过在大语言模型的注意力机制中注入因果知识,解决AI容易学习虚假关联而非真正因果关系的问题。实验显示该方法显著提升了模型在新环境下的表现,如Llama模型准确率从64.5%提升至90.5%。这项创新为开发更可靠、具备真正推理能力的AI系统提供了新思路。
    至顶网  科技行者  2025-09-26 12:21:19  
  • 伊斯法罕医科大学团队突破:让AI像人类一样"推理"预测新药成败

    伊斯法罕医科大学研究团队开发出DrugReasoner,这是首个能够像人类专家一样"推理"的药物审批预测AI系统。该系统基于LLaMA架构,不仅能预测新药是否会被批准,更重要的是能详细解释推理过程。在多项测试中表现优异,AUC值达0.732,明显超越传统方法,为制药行业提供了前所未有的透明化决策工具,有望显著提高药物研发效率。
    至顶网  科技行者  2025-09-03 12:28:51  
  • 香港大学团队打造首个牙科全景X光智能分析系统,AI医生能看懂你的口腔健康吗?

    香港大学团队构建了全球首个大规模牙科全景X光AI数据集MMOral,包含2万余张影像和130万条指令数据。研究发现现有AI模型在牙科诊断上表现不佳,最强的GPT-4o仅达41%准确率。团队开发的专业模型OralGPT经训练后准确率提升24.73%,为AI在牙科医学的应用奠定基础。
    至顶网  科技行者  2025-09-25 14:40:08  
  • InternVL3:上海AI实验室联合多所顶尖院校打造的多模态AI大模型新突破

    上海AI实验室联合清华大学等顶尖院校发布的InternVL3,通过原生多模态预训练突破了传统AI模型"先语言后视觉"的局限。该模型在MMMU基准测试中获得72.2分,超越所有开源模型,并引入变长视觉位置编码和混合偏好优化等创新技术,全面开源为AI社区贡献宝贵资源。
    至顶网  科技行者  2025-07-17 11:39:31  
  • 零一万物发布千亿参数模型Yi-Large,李开复呼吁关注TC-PMF,拒绝Ofo式烧钱打法

    5月13日,在零一万物成立一周年之际,零一万物CEO李开复博士携带千亿参数Yi-Large闭源模型正式亮相,正式进军全球SOTA顶级大模型之首,在斯坦福最新的AlpacaEval 2.0达到全球大模型Win Rate 第一。除此之外,零一万物将早先发布的Yi-34B、Yi-9B/6B中小尺寸开源模型版本升级为Yi-1.5系列,每个版本达到同尺寸中SOTA性能最佳。
    至顶网  业界供稿  2024-05-13 13:36:36  
  • 代码验证能否做到既快又准?威斯康星大学破解大型语言模型编程任务的速度与精度平衡难题

    威斯康星大学研究团队提出"生成-筛选-排序"策略,通过结合快速筛选器和智能奖励模型,在AI代码验证中实现了11.65倍速度提升,准确率仅下降8.33%。该方法先用弱验证器移除明显错误代码,再用神经网络模型精确排序,有效解决了传统方法在速度与准确性之间的两难选择,为实用化AI编程助手铺平了道路。
    至顶网  科技行者  2025-06-19 17:00:12  
  • AI大模型"想太多"会拖后腿?加州大学伯克利分校揭示大语言推理模型的认知陷阱

    加州大学伯克利分校研究团队发现,专门用于深度推理的AI模型在实际任务中容易出现"过度思考"现象,即过分依赖内部推理而忽视环境反馈。通过分析4018个AI行为轨迹,研究显示推理模型的过度思考倾向比普通模型高三倍,且过度思考程度越高任务成功率越低。研究提出了有效缓解策略,能将模型性能提升30%并降低43%计算成本。
    至顶网  科技行者  2025-08-25 10:25:00  
  • 学了七年计算机,我没换来一个初级程序员工作,也没实现留在国外的梦

    2022年的高考刚落下帷幕,填报志愿又成为了另一个战场,牵系着每个家庭的心,其中最受瞩目的就是那些热门专业。 选择热门专业往往意味着未来会有更多的工作机会、更高的收益回报,但这样真的就等于选择了一条正确的道路吗?
    至顶网  尼酱  2022-07-06 11:13:05  
  • 宾夕法尼亚大学团队让AI不再违背物理定律:一张照片就能生成符合真实物理规律的视频

    宾夕法尼亚大学研究团队开发了PhysCtrl系统,能从单张照片生成符合真实物理定律的视频。该系统通过学习55万个物理仿真数据,结合空间-时间注意力机制和物理约束,准确预测不同材质物体在外力作用下的运动轨迹,解决了传统AI视频生成中物理不合理的问题,在多项评估中显著优于现有方法。
    至顶网  科技行者  2025-10-15 08:06:01  
  • 微软研究团队揭秘:AI推理模型为什么会在"多步思考"时犯糊涂?

    微软和马萨诸塞大学研究团队通过系统分析六种AI模型在多跳推理任务中的表现,发现了AI推理中的普遍问题:过度跳跃、推理保真度随复杂性下降、以及正确答案与错误推理过程脱钩现象。研究建立了七种推理错误分类体系,并开发了自动化评估框架,为改进AI推理能力和构建可靠AI系统提供了重要指导。
    至顶网  科技行者  2025-08-12 14:17:28  
  • AI智能机器人如何学会团队合作:莫斯科科学家发明记忆共享技术让机器人告别"各自为政"

    俄国科学家开发出共享记忆变换器(SRMT)技术,通过让机器人共享记忆而非直接通信来实现协作。该技术受人类大脑全局工作空间理论启发,让每个机器人都能访问共同的记忆池。在多项测试中,SRMT显著优于传统协作方法,特别是在稀疏奖励环境下表现突出,并展现出优异的泛化能力。该技术有望应用于物流仓库、自动驾驶、搜救等需要多智能体协调的实际场景。
    至顶网  科技行者  2025-09-18 10:26:32  
  • Meta发布J1:通过强化学习激励LLM思考和做出更好的判断

    这篇研究介绍了Meta公司开发的J1系统,这是一种通过强化学习训练大语言模型进行评判的创新方法。J1将可验证和不可验证的提示转换为具有可验证奖励的判断任务,从而鼓励模型在做出决策前先进行思考。研究表明,J1在8B和70B参数规模下都超越了同等规模的现有模型,甚至在某些测试中超过了更大的模型如o1-mini和DeepSeek-R1。这种方法的核心创新在于不仅优化最终判断,还优化思考过程本身,使模型学会制定评估标准、生成参考答案并重新评估回答的正确性。
    至顶网  Hugging Face  2025-05-16 17:09:21  
  • Lightricks团队打造视频生成新利器:2秒生成5秒视频的LTX-Video模型

    LTX-Video是由以色列Lightricks公司开发的革命性开源视频生成模型,能够在2秒内生成5秒高质量视频,实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程,采用1:192的超高压缩比和共享去噪机制,在人类评估中表现显著优于同类模型。作为完全开源的项目,它为教育、营销、内容创作等多个领域提供了强大而accessible的视频生成能力。
    至顶网  科技行者  2025-09-16 11:09:43  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号