用了 0.033926秒,为您找到大发 大小 单双 有人 带么罔芷 88pkee 驻测相关内容2143 条
  • 创新力Max,英特尔亮出最新产品矩阵

    上周英特尔举办了一场引人注目的“架构日”活动,公布了未来多年的产品技术路线图、技术战略规划以及一系列新技术。
    至顶网  业界供稿  2018-12-26 16:06:47  
  • 阿里巴巴推出Ovis2.5:能看图思考的AI聊天机器人有了"火眼金睛"

    阿里巴巴推出的Ovis2.5是一个革命性的多模态AI模型,具备原生分辨率图像处理和深度推理能力。它采用五阶段训练体系,在OpenCompass评测中创造了开源模型新纪录。其突破性的思考模式让AI能够进行类人推理和自我纠错,在数学推理、图表分析、文字识别等方面表现卓越,为教育、医疗、商业等领域提供了强大的AI助手解决方案。
    至顶网  科技行者  2025-08-27 10:02:16  
  • 中国香港中文大学深圳分校:革命性语音压缩技术,让AI说话更自然更高效

    中国香港中文大学深圳分校研究团队开发了TaDiCodec语音编解码技术,实现了极低6.25Hz帧率和0.0875kbps比特率的高效语音压缩。该技术通过文本感知扩散解码器和端到端训练,在保持优异语音质量的同时显著提升压缩效率,在零样本语音合成中达到2.28%英语和1.19%中文词错误率,为AI语音系统提供了革命性的解决方案。
    至顶网  科技行者  2025-09-01 12:42:08  
  • 大模型的"藏宝图训练法":Cohere实验室让AI学会精准找到少见任务的最佳答案

    Cohere实验室提出了"Treasure Hunt"训练方法,通过在训练阶段为大语言模型添加90个详细标记(涵盖质量、长度、语言、任务类型等),创建了一套智能导航系统。该方法特别针对模型在低频"长尾任务"上的表现不佳问题,通过标记丢弃策略让模型学会自主推断。实验显示整体性能提升5.7%,长尾任务提升9.1%,代码修复任务提升14.1%,同时将长度控制违规率从36.58%降至1.25%。
    至顶网  科技行者  2025-06-23 11:46:20  
  • 从电驱到智能座舱全面覆盖,小米汽车五大自研核心技术正式披露

    刷新行业性能天花板,小米“人车家全生态”五大核心技术,小米 SU7新车亮相。
    至顶网  业界供稿  2023-12-28 18:24:42  
  • 机器人终于学会了"察言观色":上海AI实验室让机器人只需10个示例就能掌握复杂任务

    上海AI实验室等机构联合开发的Dita机器人学习模型实现重大突破,仅需10个示例就能让机器人掌握复杂任务。该模型创新性地结合扩散模型与Transformer架构,让机器人具备类似人类的环境观察和任务理解能力,在多个基准测试中表现优异,并成功完成包括倾倒液体、多步骤操作等高难度真实世界任务,为通用机器人智能发展开辟新路径。
    至顶网  科技行者  2025-08-01 10:12:08  
  • 谁才是真正的好老师?北科研团队比较不同推理蒸馏源对大语言模型影响

    这篇研究探讨了大语言模型知识蒸馏过程中教师模型选择的重要性。北科a-m-team团队从三个顶级模型(AM-Thinking-v1、Qwen3-235B-A22B和DeepSeek-R1)收集了189万个问题的推理答案,分析发现AM-Thinking-v1生成的数据表现出更多样的令牌长度分布和更低的困惑度。使用这些数据训练的学生模型在AIME2024(84.3分)、AIME2025(72.2分)、MATH500(98.4分)和LiveCodeBench(65.9分)等基准测试中,AM蒸馏模型始终表现最佳,并展现出根据任务难度动态调整输出长度的能力。
    至顶网  科技行者  2025-05-26 08:10:53  
  • VidText:视频文本理解的全面评估新基准,打造视觉文本与上下文交互的研究新高度

    VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
    至顶网  科技行者  2025-06-03 18:36:09  
  • 电子眼也能追踪3D世界:苏黎世联邦理工学院让多摄像头系统拥有了立体追踪超能力

    苏黎世联邦理工学院研究团队开发出首个多摄像头3D点追踪系统MVTracker,只需4个摄像头即可在三维空间中精确追踪任意点的运动轨迹,追踪精度达2-3厘米。该系统通过创新的点云融合技术和变换器架构,能处理复杂遮挡场景并适应不同质量的深度信息,实现了7.2帧每秒的准实时处理速度,为机器人技术、增强现实等领域带来重要突破。
    至顶网  科技行者  2025-09-05 10:11:00  
  • 阿里巴巴等机构提出SingLoRA:用一个矩阵就能让AI模型学会新技能的神奇方法

    这项由以色列理工学院等机构完成的研究提出了SingLoRA方法,用单一矩阵替代传统LoRA的双矩阵设计,解决了AI模型微调中的稳定性问题。该方法在保持性能的同时将参数量减少一半,在语言理解和图像生成任务中都表现出色,为大模型的高效适应提供了新的解决思路。
    至顶网  科技行者  2025-07-18 09:34:36  
  • 揭秘"隐形推理令牌":马里兰大学研究团队开发CoIn系统,为大模型API计费提供透明保障

    CoIn是马里兰大学研究团队开发的创新框架,旨在解决大型语言模型商业API不透明计费问题。这些API隐藏推理过程只显示最终答案,却仍对所有"看不见"的令牌收费。CoIn通过令牌数量验证和语义有效性验证两大组件,使用户能够审计隐藏令牌而不暴露专有内容。实验表明,即使面对复杂攻击,CoIn的检测成功率高达94.7%,为商业AI服务提供了前所未有的计费透明度。
    至顶网  科技行者  2025-05-27 10:11:23  
  • 用程序分析反馈训练大型语言模型生成高质量代码:加州大学圣地亚哥分校和微软的突破性研究

    这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
    至顶网  科技行者  2025-06-07 09:55:05  
  • 腾讯优图实验室突破性成果:只需一张正常图片,AI就能自动发现任何异常!

    腾讯优图实验室提出MetaUAS系统,首次实现仅用一张正常图片就能检测任何类型异常的突破。该技术将异常检测转化为变化检测问题,通过元学习训练通用模型,无需语言描述即可精确识别工业产品瑕疵,参数量仅为传统方法的1/10,推理速度快65倍,为工业质检智能化提供了全新解决方案。
    至顶网  科技行者  2025-07-10 09:35:54  
  • 从开源基础设施上海峰会我看到了一些变化与不变

    云计算已经发展到新的阶段,而OpenStack以及背后的基金会也在积极求变,在顺应技术变化和客户需求方面进行了卓有成效的探索。展望下一个十年,OpenStack的发展值得期待。
    至顶网  李祥敬  2019-11-28 09:47:02  
  • AI大脑"推理能力"被质疑:亚利桑那州立大学揭示链式思维的真面目

    亚利桑那州立大学研究团队通过DataAlchemy实验环境发现,大语言模型的链式思维推理能力实际上是一种"海市蜃楼"现象。当面对与训练数据相似的问题时AI表现优秀,但遇到略有差异的情况时推理能力会急剧下降。研究揭示AI更像是在进行精巧的模式匹配而非真正的逻辑推理,对AI实际应用具有重要警示意义。
    至顶网  科技行者  2025-08-11 14:28:52  
  • 从脑电波到语言:哥伦比亚大学团队开发Neuro2Semantic框架,仅需30分钟数据就能解读大脑中的语言

    这项哥伦比亚大学研究团队开发的Neuro2Semantic框架,能够从人类颅内脑电图信号中重建语义内容,开创了脑机接口技术的新可能。该框架通过两阶段过程工作:先用LSTM适配器将神经信号与文本嵌入对齐,再用预训练模型将这些嵌入转化为连贯文本。最令人印象深刻的是,它仅需30分钟的训练数据即可实现高效解码,远少于传统方法所需的16小时以上。研究表明该技术在未见过的语义内容上也表现出色,为帮助失语症患者等医疗应用铺平了道路。
    至顶网  科技行者  2025-07-07 17:36:29  
  • 阿里巴巴让机器开口说话:Marco-Voice如何让AI既会模仿声音又能表达情感

    阿里巴巴研究团队开发了Marco-Voice多功能语音合成系统,能够同时实现高质量的声音克隆和情感控制。通过创新的旋转情感嵌入和说话人-情感分离技术,系统可以独立调节声音身份和情感表达。团队还构建了包含10小时中文情感语音的CSEMOTIONS数据集。实验表明Marco-Voice在语音清晰度、说话人相似度和情感表达方面都显著超越现有系统,为虚拟助手、内容创作和教育技术等领域提供了强大工具。
    至顶网  科技行者  2025-08-13 09:23:03  
  • Lightricks团队打造视频生成新利器:2秒生成5秒视频的LTX-Video模型

    LTX-Video是由以色列Lightricks公司开发的革命性开源视频生成模型,能够在2秒内生成5秒高质量视频,实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程,采用1:192的超高压缩比和共享去噪机制,在人类评估中表现显著优于同类模型。作为完全开源的项目,它为教育、营销、内容创作等多个领域提供了强大而accessible的视频生成能力。
    至顶网  科技行者  2025-09-16 11:09:43  
  • 快速上手 MCP —— Anthropic 的 AI USB-C

    本文详细探讨了 MCP(Model Context Protocol)的工作原理、部署方法与应用实践,通过 Claude Desktop 和 Open WebUI 将 AI 模型与外部数据、工具无缝连接,同时分析了安全性及扩展性挑战。
    至顶网  The Register  2025-04-22 09:51:01  
  • 亚马逊Nova Premier能造出生化武器吗?三大风险领域全面安全评估揭秘

    亚马逊发布Nova Premier AI模型的首个全面安全评估报告,针对化学生物武器、网络攻击和AI自主研发三大高风险领域进行了系统性测试。研究采用自动化基准测试和人工评估相结合的方法,并邀请第三方机构独立验证。结果显示Nova Premier虽然在各领域知识水平有所提升,但实际危险操作能力仍在安全阈值内,可安全向公众开放。
    至顶网  科技行者  2025-07-18 09:35:33  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号