用了 0.057881秒,为您找到大发 大小 单双 有人 带么罔芷 88pkee 驻测相关内容3950 条
  • 机器人终于学会了"察言观色":上海AI实验室让机器人只需10个示例就能掌握复杂任务

    上海AI实验室等机构联合开发的Dita机器人学习模型实现重大突破,仅需10个示例就能让机器人掌握复杂任务。该模型创新性地结合扩散模型与Transformer架构,让机器人具备类似人类的环境观察和任务理解能力,在多个基准测试中表现优异,并成功完成包括倾倒液体、多步骤操作等高难度真实世界任务,为通用机器人智能发展开辟新路径。
    至顶网  科技行者  2025-08-01 10:12:08  
  • VidText:视频文本理解的全面评估新基准,打造视觉文本与上下文交互的研究新高度

    VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
    至顶网  科技行者  2025-06-03 18:36:09  
  • 阿里巴巴等机构提出SingLoRA:用一个矩阵就能让AI模型学会新技能的神奇方法

    这项由以色列理工学院等机构完成的研究提出了SingLoRA方法,用单一矩阵替代传统LoRA的双矩阵设计,解决了AI模型微调中的稳定性问题。该方法在保持性能的同时将参数量减少一半,在语言理解和图像生成任务中都表现出色,为大模型的高效适应提供了新的解决思路。
    至顶网  科技行者  2025-07-18 09:34:36  
  • 揭秘"隐形推理令牌":马里兰大学研究团队开发CoIn系统,为大模型API计费提供透明保障

    CoIn是马里兰大学研究团队开发的创新框架,旨在解决大型语言模型商业API不透明计费问题。这些API隐藏推理过程只显示最终答案,却仍对所有"看不见"的令牌收费。CoIn通过令牌数量验证和语义有效性验证两大组件,使用户能够审计隐藏令牌而不暴露专有内容。实验表明,即使面对复杂攻击,CoIn的检测成功率高达94.7%,为商业AI服务提供了前所未有的计费透明度。
    至顶网  科技行者  2025-05-27 10:11:23  
  • 用程序分析反馈训练大型语言模型生成高质量代码:加州大学圣地亚哥分校和微软的突破性研究

    这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
    至顶网  科技行者  2025-06-07 09:55:05  
  • “时运决定一切”:林书豪、蔡崇信和杨安泽的故事

    “态度决定一切”,是判断一个人能否取得成功的名言警句,然而有时候即使有了态度,还需要时运的加持,因为“时运”的背后,往往意味着“时代的脉搏”。
    至顶网  赛博故事(cybergushi)  2019-08-23 16:46:44  
  • 人工智能学会了看懂动作!复旦大学团队的视频识别新突破

    复旦大学研究团队开发了MOVE数据集和DMA算法,让AI系统能够像人类一样根据动作模式而非外观来理解视频内容。该系统包含224个动作类别和26万帧标注数据,通过解耦动作与外观特征,实现了突破性的视频分割效果。这项技术在视频编辑、体育分析、安防监控等领域具有广阔应用前景,代表了从静态识别向动态理解的重要技术进步。
    至顶网  科技行者  2025-08-05 10:36:22  
  • 腾讯优图实验室突破性成果:只需一张正常图片,AI就能自动发现任何异常!

    腾讯优图实验室提出MetaUAS系统,首次实现仅用一张正常图片就能检测任何类型异常的突破。该技术将异常检测转化为变化检测问题,通过元学习训练通用模型,无需语言描述即可精确识别工业产品瑕疵,参数量仅为传统方法的1/10,推理速度快65倍,为工业质检智能化提供了全新解决方案。
    至顶网  科技行者  2025-07-10 09:35:54  
  • 从开源基础设施上海峰会我看到了一些变化与不变

    云计算已经发展到新的阶段,而OpenStack以及背后的基金会也在积极求变,在顺应技术变化和客户需求方面进行了卓有成效的探索。展望下一个十年,OpenStack的发展值得期待。
    至顶网  李祥敬  2019-11-28 09:47:02  
  • AI大脑"推理能力"被质疑:亚利桑那州立大学揭示链式思维的真面目

    亚利桑那州立大学研究团队通过DataAlchemy实验环境发现,大语言模型的链式思维推理能力实际上是一种"海市蜃楼"现象。当面对与训练数据相似的问题时AI表现优秀,但遇到略有差异的情况时推理能力会急剧下降。研究揭示AI更像是在进行精巧的模式匹配而非真正的逻辑推理,对AI实际应用具有重要警示意义。
    至顶网  科技行者  2025-08-11 14:28:52  
  • 从脑电波到语言:哥伦比亚大学团队开发Neuro2Semantic框架,仅需30分钟数据就能解读大脑中的语言

    这项哥伦比亚大学研究团队开发的Neuro2Semantic框架,能够从人类颅内脑电图信号中重建语义内容,开创了脑机接口技术的新可能。该框架通过两阶段过程工作:先用LSTM适配器将神经信号与文本嵌入对齐,再用预训练模型将这些嵌入转化为连贯文本。最令人印象深刻的是,它仅需30分钟的训练数据即可实现高效解码,远少于传统方法所需的16小时以上。研究表明该技术在未见过的语义内容上也表现出色,为帮助失语症患者等医疗应用铺平了道路。
    至顶网  科技行者  2025-07-07 17:36:29  
  • 阿里巴巴让机器开口说话:Marco-Voice如何让AI既会模仿声音又能表达情感

    阿里巴巴研究团队开发了Marco-Voice多功能语音合成系统,能够同时实现高质量的声音克隆和情感控制。通过创新的旋转情感嵌入和说话人-情感分离技术,系统可以独立调节声音身份和情感表达。团队还构建了包含10小时中文情感语音的CSEMOTIONS数据集。实验表明Marco-Voice在语音清晰度、说话人相似度和情感表达方面都显著超越现有系统,为虚拟助手、内容创作和教育技术等领域提供了强大工具。
    至顶网  科技行者  2025-08-13 09:23:03  
  • Lightricks团队打造视频生成新利器:2秒生成5秒视频的LTX-Video模型

    LTX-Video是由以色列Lightricks公司开发的革命性开源视频生成模型,能够在2秒内生成5秒高质量视频,实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程,采用1:192的超高压缩比和共享去噪机制,在人类评估中表现显著优于同类模型。作为完全开源的项目,它为教育、营销、内容创作等多个领域提供了强大而accessible的视频生成能力。
    至顶网  科技行者  2025-09-16 11:09:43  
  • 从244到1173亿美元,回望戴尔这六年

    随着戴尔科技重返公开市场,以及2019财年最新财报的公布,其具体财报情况也再次引发了业界的关注。
    至顶网  至顶网云计算频道  2019-03-28 16:48:06  
  • 快速上手 MCP —— Anthropic 的 AI USB-C

    本文详细探讨了 MCP(Model Context Protocol)的工作原理、部署方法与应用实践,通过 Claude Desktop 和 Open WebUI 将 AI 模型与外部数据、工具无缝连接,同时分析了安全性及扩展性挑战。
    至顶网  The Register  2025-04-22 09:51:01  
  • 为何敢弃大厂投身制造业?他的跨界之旅藏着怎样的秘密?

    技术创新的漫漫长路,总有人上下求索,用执着和热情推动着技术的洪流滚滚向前。
    至顶网  至顶网码客人生频道  2024-09-11 10:03:47  
  • 游戏出海靠买量的时代结束了

    2025 年,成为全球游戏行业由“流量红利”迈向“结构性变革”的关键拐点。
    至顶网  周雅  2025-08-08 12:01:15  
  • 亚马逊Nova Premier能造出生化武器吗?三大风险领域全面安全评估揭秘

    亚马逊发布Nova Premier AI模型的首个全面安全评估报告,针对化学生物武器、网络攻击和AI自主研发三大高风险领域进行了系统性测试。研究采用自动化基准测试和人工评估相结合的方法,并邀请第三方机构独立验证。结果显示Nova Premier虽然在各领域知识水平有所提升,但实际危险操作能力仍在安全阈值内,可安全向公众开放。
    至顶网  科技行者  2025-07-18 09:35:33  
  • 华为徐直军:人工智能将发生10大巨变,我们会提供全栈全场景的能力

    刚刚第三届HUAWEI CONNECT 2018(华为全联接大会)上,徐直军公布了华为AI发展战略,以及华为AI全栈全场景解决方案,包括华为自研统一达芬奇架构的两款AI芯片——昇腾910和昇腾310。
    至顶网  科技行者  2018-10-10 10:36:10  
  • 阿里达摩院推出VL-Cogito:多模态推理能力突破的渐进式课程强化学习框架

    阿里达摩院联合复旦大学开发了VL-Cogito多模态推理模型,采用创新的渐进式课程强化学习框架PCuRL。该系统模仿人类学习方式,通过三阶段训练让AI学会根据问题难度智能调整回答详细程度。VL-Cogito在十个基准测试中表现卓越,展现了在数学、科学、逻辑推理等多领域的强大能力,为多模态AI实际应用开辟了新路径。
    至顶网  科技行者  2025-08-06 11:08:34  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号