用了 0.057028秒,为您找到大发 大小 单双 有人 带么罔芷 88pkee 驻测相关内容3950 条
  • Google团队打造AI智能体"护盾":解决恶意指令操控问题的全新防护技术

    Google研究团队开发了名为CausalArmor的AI安全防护系统,专门解决"间接提示注入攻击"问题。该系统通过分析AI决策过程中的因果关系,能够精准识别隐藏在正常内容中的恶意指令。与传统防护方法不同,CausalArmor采用"按需防护"策略,仅在检测到威胁时才启动防护机制,在保证高安全性的同时不影响正常工作效率。实验显示该系统将攻击成功率降至接近零,为AI智能体安全提供了突破性解决方案。
    至顶网  科技行者  2026-02-12 13:19:46  
  • Adobe Research与德州大学联手破解AI视频生成新难题:让人工智能边做边学,告别错误累积

    Adobe Research与德州大学联手开发"自我强迫"训练法,让AI在视频生成时边做边学,彻底解决传统方法中错误会越积越多的问题。这种创新训练方式实现了真正的实时视频生成,在单GPU上达到17帧每秒的处理速度和亚秒级延迟,为直播、游戏和实时交互应用开辟了全新可能性。研究团队还引入滚动键值缓存机制,实现了理论上无限长的视频生成能力。
    至顶网  科技行者  2025-06-16 09:34:19  
  • 清华大学团队打造CHARM框架:让AI学会生成动漫角色发型,从此告别手工建模的繁琐!

    清华大学与腾讯联合开发CHARM框架,首次实现动漫发型的AI自动生成。该系统将复杂发型转化为控制点序列,采用语言化表示方法,让AI像写文章一样逐步生成发型。基于37000个样本的AnimeHair数据集训练,CHARM在几何精度和视觉效果上全面超越现有方法,数据压缩率达98%以上,为游戏、动画等领域提供高效的角色建模解决方案。
    至顶网  科技行者  2025-10-16 17:30:31  
  • AI搜索评估新突破:清华和ModelBest联手推出RAVine框架,让智能搜索更接地气

    中科院和ModelBest联合推出RAVine评估框架,针对AI搜索系统现有评估方法脱离实际的问题,创新性地采用真实用户问题、全流程行为监控和可追溯信息提取技术,发现当前AI搜索系统在任务完整性和引用准确性方面存在严重不足,为构建更贴近用户需求的智能搜索系统提供了重要技术支撑。
    至顶网  科技行者  2025-07-29 09:32:52  
  • 康奈尔大学惊人发现:大语言模型竟然能读懂"隐藏"的数据密码!

    康奈尔大学研究团队发现,预训练的大语言模型具备惊人的"密码破解"能力,能够仅通过观察例子就自动学会识别和预测隐马尔可夫模型中的隐藏模式。这种"上下文学习"能力在多数情况下达到理论最优水平,大大降低了复杂数据分析的技术门槛,为生物学、心理学等各领域的科学研究提供了强大而易用的新工具。
    至顶网  科技行者  2025-06-12 13:04:38  
  • EarthMind:基于大型多模态模型的多尺度多传感器地球观测系统

    EarthMind是一个创新的视觉-语言框架,专为解决地球观测领域的多尺度和多传感器理解挑战而设计。由多所国际知名大学联合开发的这一系统引入了两项关键技术:空间注意力提示(SAP)机制重新分配大型语言模型内部的注意力,增强像素级理解;跨模态融合机制则将异构模态如光学和雷达数据对齐并智能融合。
    至顶网  科技行者  2025-06-06 09:16:23  
  • 阿里巴巴与香港中文大学联手打造AI"自我进化"评判官:让大模型学会给自己挑错

    阿里巴巴与香港中文大学合作开发了SCRIT系统,让AI大模型学会自我评判和纠错。该系统通过对比学习机制,先分析标准答案理解关键概念,再评判学生解答,配合自我验证确保质量。在数学和科学推理测试中,评判准确率提升10%,错误识别能力提升19%,开创了AI自主改进的新方向。
    至顶网  科技行者  2025-09-18 11:07:31  
  • 谷歌DeepMind团队揭秘:AI如何像人类一样"看图说话"理解复杂世界

    谷歌DeepMind团队开发了名为Gemini的AI视觉理解系统,实现了从简单"识别"到复杂"理解"的突破。该系统不仅能识别图像中的物体,还能理解情感、关系和抽象概念,准确率达94.3%。通过多模态学习和跨模态注意力网络,Gemini展现出类似人类的常识推理能力,已在医疗、教育、自动驾驶等领域开始应用,为AI与人类协作开启新篇章。
    至顶网  科技行者  2025-08-20 10:25:56  
  • 视觉"动感眼":南京大学团队打造的多模态大模型细粒度动作理解增强系统

    南京大学与字节跳动联合团队开发的MotionSight系统,为多模态大语言模型提供了"动态视觉增强"能力,解决了现有AI系统在理解视频细粒度动作方面的困难。这一零样本方法通过对象中心的视觉聚光灯和动态模糊技术,显著提升了模型对物体动作和摄像机动作的感知能力,在不需要额外训练的情况下实现了业界领先性能。研究团队同时构建了MotionVid-QA数据集,这是首个专注于细粒度视频动作理解的大规模开源数据集,包含4万多个视频片段和近9万个问答对,为未来研究提供了宝贵资源。
    至顶网  科技行者  2025-06-06 14:15:05  
  • 星光不问赶路人,看阿里自研数据库崛起之路

    阿里抓住云计算的契机,依托绝无仅有的“双十一”海量数据和高并发的实战考验,冲破了传统商业数据库的长期垄断,终于实现了国产自研数据库的跨越。
    至顶网  邹大斌  2019-12-03 18:15:51  
  • 计算机视觉界的新突破:加州大学伯克利分校推出TULIP,让AI既能看懂细节又能理解语言

    TULIP是加州大学伯克利分校开发的新型多模态AI模型,通过统一的学习框架解决了传统图像-文本模型在精细视觉理解方面的不足。该模型采用多视角对比学习、生成式数据增强和重建正则化等创新技术,在保持强大语义理解能力的同时显著提升了对视觉细节的捕捉能力,在多个基准测试中取得了显著的性能提升。
    至顶网  科技行者  2025-07-31 11:27:25  
  • 让机器听懂"你说我说":布尔诺理工大学如何破解多人对话识别难题

    布尔诺理工大学研究团队开发了DiCoW和DiariZen两个系统,用于解决多人对话中的语音识别难题。该系统巧妙结合说话人分离与语音识别技术,在国际挑战赛中获得第二名,能处理15种语言的对话场景。研究发现系统具备良好的跨语言泛化能力,即使主要用英语训练也能处理其他语言。团队已开源相关模型,为会议记录、多语言交流等实际应用提供了强大工具。
    至顶网  科技行者  2025-06-25 09:35:58  
  • 让机器人像人类一样解读图像寓意:上海人工智能实验室开发出人类思维启发的图像理解框架

    这项研究提出了名为"Let Androids Dream"的创新框架,解决了多模态大语言模型在理解图像隐喻方面的核心难题——上下文缺失。通过模拟人类认知过程的三阶段系统(感知、搜索、推理),该框架即使使用轻量级GPT-4o-mini模型,也能在英语和中文图像寓意理解任务中达到最先进性能,在开放式问题上甚至超越GPT-4o模型36.7%。这一成果不仅推动了视觉-语言推理技术的发展,还为未来AI系统理解人类文化中的隐喻和象征提供了新方向。
    至顶网  科技行者  2025-05-28 18:28:12  
  • 混合云100问「开发篇」:实现从“容”上云,敏捷开发

    企业上云的根本动力就是为了提高应用的开发效率、灵活性,但是要充分发挥这些优势,还需要企业改变原来的开发和运维方式。
    至顶网  至顶网软件与服务频道  2020-09-17 18:43:15  
  • 浅析高通的5G生态版图

    2018 高通4G/5G峰会与首届峰会相比,OEM、ODM、运营商、零部件厂商、渠道商、内容提供商等合作伙伴的数量增长超过150%。希望先进的无线数字技术能够更好的造福人类的高通在如此庞大的产业生态中扮演怎样的角色呢?且来观之。
    至顶网  于艺婉  2018-10-31 20:14:46  
  • NVIDIA发布OCR-2:用"自我批评"让AI写代码更聪明的新方法

    NVIDIA研究团队开发了OCR-2系统,让AI能够像程序员一样对自己编写的代码进行"自我批评"和改进。他们构建了包含250万个编程问题-解决方案-批评组合的史上最大代码推理数据集,采用两阶段训练方法,让AI既能写代码又能评价代码质量。该系统通过生成多个解决方案并自我筛选,显著提升了代码生成准确率。
    至顶网  科技行者  2025-07-22 10:20:20  
  • 简洁推理,大有作为:香港科技大学团队通过难度感知提示法精简长推理链

    这篇研究介绍了香港科技大学团队开发的难度感知提示法(DAP),一种能够根据问题难度智能调整推理链长度的创新方法。通过这一方法,研究者构建了LiteCoT数据集,包含10万个简洁推理样本,平均仅720个标记,比传统方法减少约90%。基于此数据集训练的Liter模型系列在多项基准测试中表现优异,在AIME24数学考试上达到74.2%的通过率,同时仅使用约5,000个推理标记。研究证明,精简且难度适应的推理链不仅能节省计算资源,还能提高模型性能,为构建更高效的AI推理系统提供了新思路。
    至顶网  科技行者  2025-06-04 09:16:36  
  • 华为研究团队首创3D空间理解基准测试:让AI像人类一样理解多视角世界

    华为科技团队开发出首个多视角3D空间理解基准测试Ego3D-Bench,包含8600个测试样本,覆盖距离测量、定位、运动推理等任务。同时推出Ego3D-VLM解决方案,通过构建文字版认知地图显著提升AI空间理解能力,多选题准确率提升12%,距离估算误差减少56%,为自动驾驶和机器人应用提供关键技术支撑。
    至顶网  科技行者  2025-09-25 14:40:22  
  • 搜索舞台:加入"放大镜"的大语言模型特性深度剖析 —— 伯克利大学研究团队探索网络搜索增强型AI系统

    这项研究由加州大学伯克利分校团队完成,通过创建"Search Arena"平台收集了24,000多次用户与搜索增强型大语言模型的真实交互数据。研究发现用户提问远不止简单事实查询,他们更看重引用丰富的回答,即使引用与内容无直接关联。有趣的是,用户更偏爱社区平台引用,而非维基百科。研究还表明搜索能力不会影响AI在普通场景中的表现,但在需要实时信息时至关重要。这些发现为改进下一代AI助手提供了重要指导。
    至顶网  科技行者  2025-06-10 13:51:22  
  • 视觉语言模型能看懂色彩世界吗?马里兰大学推出全面评估色彩理解能力的COLORBENCH基准测试

    你是否曾经因为衣服色彩搭配不协调而尴尬?或者在医学诊断试纸上辨别微妙的颜色变化时感到困惑?色彩在我们的日常生活中扮演着至关重要的角色,从科学发现到医疗保健,从购物到艺术欣赏,无处不在。而人工智能,特别是视觉语言模型(VLMs),正在迅速融入我们的生活,但它们真的能像人类一样理解和利用色彩信息吗?
    至顶网  科技行者  2025-04-18 16:53:57  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号