用了 0.121434秒,为您找到mg 性价比 最高 高达 網纸 YB233相关内容9826 条
  • AI的视觉盲点:伊利诺伊大学团队揭示多模态推理中的"看不见"问题

    伊利诺伊大学研究团队发现AI在多模态推理中存在严重的视觉理解缺陷,67%的错误源于对图像信息的误解。他们开发了PAPO方法,通过图像遮挡技术强迫AI真正使用视觉信息,实现了4.4%的性能提升。这项研究对AI在教育、医疗、自动驾驶等领域的可靠应用具有重要意义。
    至顶网  科技行者  2025-07-18 09:37:47  
  • 复旦大学推出BMMR数据集:让AI跨越知识鸿沟,从数学天才走向通识博士

    复旦大学团队发布BMMR数据集,这是首个大规模跨学科多模态推理评估基准,包含11万个涵盖300个学科的大学水平问题。研究发现即使最先进的AI模型在跨学科推理中表现有限,揭示了当前AI发展的重要盲点。该数据集支持中英双语,配备专门的推理过程评估工具,为AI向通用智能发展提供重要支撑。
    至顶网  科技行者  2025-07-11 10:15:30  
  • 大模型的"藏宝图训练法":Cohere实验室让AI学会精准找到少见任务的最佳答案

    Cohere实验室提出了"Treasure Hunt"训练方法,通过在训练阶段为大语言模型添加90个详细标记(涵盖质量、长度、语言、任务类型等),创建了一套智能导航系统。该方法特别针对模型在低频"长尾任务"上的表现不佳问题,通过标记丢弃策略让模型学会自主推断。实验显示整体性能提升5.7%,长尾任务提升9.1%,代码修复任务提升14.1%,同时将长度控制违规率从36.58%降至1.25%。
    至顶网  科技行者  2025-06-23 11:46:20  
  • 印度学生的数学神器:Physics Wallah团队打造出专门为JEE考试优化的AI数学助手Aryabhata

    Physics Wallah团队开发的Aryabhata 1.0是专为印度JEE数学考试优化的70亿参数AI模型。通过融合三个不同特长的数学模型,使用25万道精选题目进行训练,并采用创新的强化学习技术,Aryabhata在2025年JEE考试中取得86%-90%的准确率。该模型不仅解题精确,更能提供清晰的教学指导,已开源发布,标志着AI教育应用的重要突破。
    至顶网  科技行者  2025-08-15 08:49:28  
  • 数据中心电池系统的电气保护设计与分析

    作为能量存储器件,电池(尤其是锂电)能量高,内阻低,短路危害大,因此电池系统必须配备完善的保护措施以规避过载或短路可能带来的风险。如何为电池系统配置适合的电气保护系统将是本文讨论的重点。
    至顶网  通信电源技术  2025-01-08 11:04:41  
  • VidText:视频文本理解的全面评估新基准,打造视觉文本与上下文交互的研究新高度

    VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
    至顶网  科技行者  2025-06-03 18:36:09  
  • 川普的新冠病毒应对策略——关于我们知道和不知道的一切

    关于治疗Covid-19的药物,这里是“我们知道和不知道的一切”——「羟氯喹」,或「氯喹」,或「奎宁」。
    至顶网  科技行者  2020-04-13 18:54:23  
  • LLM循环助力:创建PARADEHATE数据集实现仇恨言论无毒化

    这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
    至顶网  科技行者  2025-06-05 18:02:59  
  • 记忆坚实的世界:斯坦福和上海交大研究团队为视频世界模型打造长期空间记忆

    斯坦福大学和上海交大等机构的研究团队提出了一种为视频世界模型增加长期记忆能力的创新方法。受人类记忆机制启发,他们设计了三种互补的记忆系统:短期工作记忆、基于点云的长期空间记忆和稀疏情节记忆。这种组合允许AI在生成长视频时保持场景的空间一致性,解决了现有模型因有限上下文窗口导致的"遗忘"问题。实验表明,该方法在视角回忆一致性和整体视频质量方面显著优于现有技术,为创建持续一致的虚拟世界铺平了道路。
    至顶网  科技行者  2025-06-09 16:59:05  
  • CheXGenBench:一个全面评估合成胸部X光片保真度、隐私性和实用性的统一基准框架

    CheXGenBench是爱丁堡大学和三星AI中心研究团队开发的首个全面评估合成胸部X光片的基准框架,从保真度、隐私风险和临床实用性三方面对11种文本到图像生成模型进行评估。研究发现现有评估方法存在重大缺陷,特别是在衡量生成质量时。Sana模型表现最佳,基于此发布了SynthCheX-75K数据集,包含75K高质量合成X光片。该框架为医学AI社区建立了统一标准,促进公平比较和未来研究发展。
    至顶网  科技行者  2025-05-21 14:26:32  
  • 以鸽子为载体的“鸽联网”仍是数据传输的最快方式

    在今天的这篇文章中,我们将进一步介绍基于鸽子的“鸽联网”是如何工作的,以及其中的现实意义。
    至顶网  科技行者  2019-04-10 22:22:59  
  • 测试仪向来不靠谱,AI令情况进一步恶化

    对基于AI型欺诈识别方案的深入研究。
    至顶网  MIT Technology Review  2020-03-17 16:53:56  
  • 手机和AR眼镜也能处理超长视频了!汉阳大学团队突破内存限制实现实时视频理解

    韩国汉阳大学联合高通AI研究院开发出InfiniPot-V框架,解决了移动设备处理长视频时的内存限制问题。该技术通过时间冗余消除和语义重要性保留两种策略,将存储需求压缩至原来的12%,同时保持高准确性,让手机和AR眼镜也能实时理解超长视频内容。
    至顶网  科技行者  2025-06-25 17:00:16  
  • 这穿越周期的骁龙,与生态握手,做时间的朋友

    在不断发明新技术,启动新市场的过程中,高通并非独乐乐的“孤勇者”,而是始终以“生态赋能”为座右铭,以自己的方法论,创造不同的潮流,与伙伴们共同穿越周期。每一年的骁龙峰会,就是最佳例证。
    至顶网  周雅  2022-12-06 10:36:09  
  • 英特尔亮相2023开放原子全球开源峰会:秉持全栈软件开放战略,助推科技创新

    开源是推动科技创新的关键路径,尤其是在软件定义时代的今天,凭借着开放、共享、灵活、包容等特点,开源已经成为推动全球企业数字化发展的重要推手。
    至顶网  业界供稿  2023-06-16 15:45:44  
  • OPPO AI团队首次系统探索:让AI智能体进行推理思考的四大策略

    OPPO AI团队首次系统性探索了如何让AI智能体进行更深入的推理思考。研究提出ATTS框架,包含并行采样、序列修正、验证合并和多样化探索四大策略。实验发现,给智能体更多尝试机会能显著提升性能,但关键在于知道何时反思而非盲目增加思考。多模型协作效果尤其突出,四个AI模型协作成功率达74.55%。这项工作为AI智能体发展指明了从增大模型转向优化推理策略的新方向。
    至顶网  科技行者  2025-06-24 10:13:19  
  • 这穿越周期的骁龙,与生态握手,做时间的朋友

    在不断发明新技术,启动新市场的过程中,高通并非独乐乐的“孤勇者”,而是始终以“生态赋能”为座右铭,以自己的方法论,创造不同的潮流,与伙伴们共同穿越周期。每一年的骁龙峰会,就是最佳例证。
    至顶网  周雅  2022-12-05 20:48:35  
  • 分段优化:让大语言模型通过段级信用分配更高效地学习推理能力

    这篇研究论文《段级策略优化》提出了一种介于词元级和轨迹级之间的新型强化学习框架SPO,用于提升大语言模型的推理能力。研究者将生成序列划分为连续段落,并在段级粒度上估计优势,实现了更精确的信用分配和更准确的优势估计。SPO框架包含灵活段落划分、基于蒙特卡洛的段落优势估计和段落优势策略优化三个核心组件。研究团队基于此框架设计了SPO-chain和SPO-tree两个特定实例,分别针对短链思维和长链思维场景。
    至顶网  科技行者  2025-06-09 09:41:19  
  • 打破僵硬动作!南洋理工大学团队为人类视频补帧注入3D控制能力

    南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
    至顶网  科技行者  2025-06-07 09:52:35  
  • 亚马逊云科技推出Amazon Q:重塑未来工作方式

    2023 年11月29日,亚马逊云科技在2023 re:Invent全球大会上推出Amazon Q,这是一种新型生成式AI支持的助手,专门用于满足办公场景需要,可以根据客户业务进行定制。
    至顶网  至顶网软件与服务频道  2023-11-29 17:25:02  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号