用了 0.041881秒,为您找到北京 pk 精准 人工 计划 软件 網纸 YB233相关内容3248 条
  • 斯坦福大学突破:AI能否像人类一样判断创意写作的好坏?

    斯坦福大学研究团队创建了全球首个创意写作评估基准LitBench,通过分析Reddit写作社区的4万多对故事比较数据,训练AI模型判断创意写作质量。研究发现专门训练的小型奖励模型(78%准确率)能超越大型语言模型评委(73%),但添加推理链反而降低了表现,揭示了创意评判需要直觉性判断的特点。
    至顶网  科技行者  2025-07-11 09:48:53  
  • RICE:DeepGlint推出让AI能像人类一样精准"看懂"图片细节的新方法

    DeepGlint等机构联合发布RICE方法,通过区域感知聚类判别技术显著提升AI的图像细节理解能力。该方法构建了包含20亿区域的大规模数据集,设计了统一的物体识别和文字识别学习框架,在多项任务上超越现有主流模型,特别是在OCR和精细视觉理解方面表现突出,为多模态AI应用提供了更强大的视觉基础。
    至顶网  科技行者  2025-08-05 10:32:56  
  • SynthRL:新加坡国立大学团队如何通过可验证数据合成提升视觉推理能力

    新加坡国立大学研究团队开发的SynthRL是一种创新的数据合成管道,旨在提升视觉语言模型的推理能力。该方法通过三阶段流程自动生成更具挑战性的训练数据:首先基于难度选择模型已掌握的简单问题,然后生成保留原始答案的更复杂变体,最后验证问题的正确性与难度增加。应用于MMK12数据集后,研究生成了3300多个高质量问题,并在五个视觉数学推理基准上实现显著性能提升,尤其在最困难的样本上效果最为明显。这一研究证明了智能数据合成在增强AI推理能力方面的重要价值,为视觉语言模型的进一步发展开辟了新途径。
    至顶网  科技行者  2025-06-06 17:28:14  
  • 视觉"动感眼":南京大学团队打造的多模态大模型细粒度动作理解增强系统

    南京大学与字节跳动联合团队开发的MotionSight系统,为多模态大语言模型提供了"动态视觉增强"能力,解决了现有AI系统在理解视频细粒度动作方面的困难。这一零样本方法通过对象中心的视觉聚光灯和动态模糊技术,显著提升了模型对物体动作和摄像机动作的感知能力,在不需要额外训练的情况下实现了业界领先性能。研究团队同时构建了MotionVid-QA数据集,这是首个专注于细粒度视频动作理解的大规模开源数据集,包含4万多个视频片段和近9万个问答对,为未来研究提供了宝贵资源。
    至顶网  科技行者  2025-06-06 14:15:05  
  • 寻找永葆青春的密码,这家公司终极目标是用AI搞定“长生不老”

    Insilico Medicine是一家诞生于数字化时代,或者说计算机时代的企业。这家公司位于巴尔的摩,其专注于利用新一代人工智能与区块链技术进行药物发现、生物标记开发以及衰老研究。
    至顶网  科技行者  2018-02-22 12:28:04  
  • 让机器听懂"你说我说":布尔诺理工大学如何破解多人对话识别难题

    布尔诺理工大学研究团队开发了DiCoW和DiariZen两个系统,用于解决多人对话中的语音识别难题。该系统巧妙结合说话人分离与语音识别技术,在国际挑战赛中获得第二名,能处理15种语言的对话场景。研究发现系统具备良好的跨语言泛化能力,即使主要用英语训练也能处理其他语言。团队已开源相关模型,为会议记录、多语言交流等实际应用提供了强大工具。
    至顶网  科技行者  2025-06-25 09:35:58  
  • 痛击马斯克:Meta打造Threads的幕后故事

    一家身陷危机的公司返璞归真,并迅速掀起病毒式传播。但如此赤裸裸地复制Twitter,能否为这家老迈的科技巨头注入新的活力?
    至顶网  The Washington Post  2023-08-02 11:10:15  
  • 香港科技大学团队突破:让AI像真正的设计师一样,一步步"拼积木"创造3D世界

    香港科技大学团队开发了名为CoPart的革命性3D生成技术,它模仿人类设计师的工作方式,将复杂3D物体分解为多个部件分别生成再组装。该技术采用双重编码策略和相互指导机制,确保各部件既精细独立又协调统一。研究团队还构建了包含91000个部件的大规模数据集PartVerse。实验显示CoPart在生成质量上显著优于传统方法,并支持部件编辑、关节物体生成等多种应用,为3D内容创作开辟了新方向。
    至顶网  科技行者  2025-07-21 11:30:41  
  • 到底“谁”最需要无人驾驶汽车?

    想要开发出几乎能够适应一切道路状况的无人驾驶汽车,无疑是项极度严苛的挑战。
    至顶网  科技行者  2020-05-19 18:18:09  
  • 上海交大和复旦大学揭秘:AI视觉模型的"视觉陷阱"——当智能助手被恶意操控时会发生什么?

    上海交大和复旦大学研究团队发现了AI视觉系统的重大安全漏洞——IAG攻击。这种攻击能让AI助手在视觉定位时被恶意操控,无论用户询问什么,都会指向攻击者预设的错误目标,且几乎无法被察觉。实验显示攻击成功率超65%,现有防御技术完全失效,对机器人、自动驾驶等应用构成严重威胁。
    至顶网  科技行者  2025-08-18 10:18:19  
  • 北大团队揭秘:如何让3D渲染技术从"手工作坊"升级为"智能工厂"

    北京航空航天大学等机构联合提出NeRF-GS框架,将神经辐射场NeRF与3D高斯点云3DGS进行协同优化。该方法通过特征共享、残差向量建模和联合优化三大机制,有效解决了3DGS对初始化敏感、空间感知有限等问题,在保持实时渲染的同时显著提升了图像质量,为3D场景表示技术融合提供了新思路。
    至顶网  科技行者  2025-08-06 11:09:36  
  • 中科大团队挑战AI视觉:让AI真正"看懂"世界,不只是回答问题

    研究团队开发了IR3D-Bench基准测试,要求AI根据单张图片重建完整3D场景,以此检验AI是否真正理解所见世界。测试涵盖20多个顶尖AI模型,结果显示虽然AI在物体识别上表现出色,但在空间关系理解和尺寸估计方面存在明显不足。研究为评估AI视觉理解能力提供了新标准。
    至顶网  科技行者  2025-07-03 16:24:32  
  • 西湖大学重磅突破:只用文字就能训练AI看图,成本降低96%的神奇技术

    西湖大学研究团队开发了Unicorn技术,首次实现仅用文字训练视觉语言AI模型,无需任何真实图片。该方法通过三阶段数据合成流程,将文字描述转换为合成图像表征,训练的Unicorn-8B模型在多项测试中表现优异。相比传统方法,成本降低96%、时间缩短73%,为AI训练提供了高效经济的新路径。
    至顶网  科技行者  2025-07-14 09:50:43  
  • 机器人学会"技能混搭":斯坦福等顶尖高校让人形机器人变身全能助手

    本研究由斯坦福大学等顶尖学府联合提出SkillBlender方法,让人形机器人像人类学习技能一样先掌握基础技能,再智能混合应对复杂任务。通过预训练行走、伸手、蹲起、踏步四种原始技能,系统能以最少的奖励设计完成复杂全身协调任务。新建的SkillBench测试平台包含三种机器人、八项任务,并创新性地评估动作准确性和自然度。
    至顶网  科技行者  2025-06-19 12:53:19  
  • 从电驱到智能座舱全面覆盖,小米汽车五大自研核心技术正式披露

    刷新行业性能天花板,小米“人车家全生态”五大核心技术,小米 SU7新车亮相。
    至顶网  业界供稿  2023-12-28 18:24:42  
  • 伊利诺伊大学团队打造"智能图书管理员":让学术论文自动分类不再是梦

    伊利诺伊大学团队开发的TaxoAdapt框架革新了学术论文自动分类技术,通过多维度分析和自适应扩展机制,能够动态构建反映学术演进趋势的分类体系。该系统在多项指标上显著优于现有方法,成功捕捉了从BERT时代到指令调优时代的学术转变,为学术文献组织和知识发现提供了智能化解决方案。
    至顶网  科技行者  2025-06-18 11:12:46  
  • 七个2020年服务器的发展趋势

    作为服务器行业的全球优秀者,戴尔易安信汇聚了全球服务器研发领域优秀的人才,他们对服务器行业的观察和思考,可以说是未来服务器发展的重要风向标。
    至顶网  戴尔  2020-02-18 16:49:24  
  • 卡内基梅隆大学研究团队突破性解决AI推理效率难题:让机器像侦探一样聪明破案

    卡内基梅隆大学研究团队提出MRT方法,通过元强化学习优化AI推理过程。该方法不仅关注最终答案正确性,还奖励思考过程中的有效进展,解决了现有AI"思考时间长但效率低"的问题。实验显示MRT在数学推理任务中准确率提升2-3倍,计算效率提升1.5-5倍,为构建更智能高效的AI系统提供了新路径。
    至顶网  科技行者  2025-07-31 11:25:45  
  • 惠普商用终端全面更新:推出新款EliteBook、战系列、ZBook等系列新品

    更高效、更安全、更灵活的AI PC产品组合及创新解决方案,深化人与工作、员工与企业的关系。
    至顶网  刘文轩  2024-05-11 10:26:07  
  • 让AI炒股变得更聪明:哈佛大学等团队发明的"智能交易员"如何用对话模式赚钱

    这是一项融合大语言模型与强化学习的金融交易AI创新研究。哈佛等知名院校团队开发的FLAG-TRADER系统让仅1.35亿参数的小型AI模型在股票和加密货币交易中超越了GPT-4等大型商业模型。该系统通过部分微调和夏普比率奖励机制,实现了既能理解复杂市场信息又能从交易实践中持续学习的智能交易决策,为AI在金融领域的应用开辟了新路径。
    至顶网  科技行者  2025-08-20 18:05:38  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号