用了 0.128339秒,为您找到大发 玩和值 稳定 中方 法规 罔芷 88pkee 驻测相关内容9124 条
  • 从“三驾马车”到“安全可持续” 戴尔科技全面开启现代化“新解法”

    春季新品发布会上,戴尔科技从底层技术到终端应用的全方位创新得到了全面展示!
    至顶网  毛烁  2025-04-25 13:25:25  
  • 埃因霍芬理工大学团队用AI"擦拭"心脏超声影像的技术突破

    荷兰埃因霍芬理工大学研究团队开发出一种智能心脏超声除雾技术,能够自动识别图像中被"雾霾"污染的区域并进行有针对性清理。该技术结合语义分割和扩散模型,首先让AI识别心脏各部分结构,然后根据不同区域特点采用不同强度的除雾处理,在国际挑战赛中表现优异,为解决心脏超声图像质量问题提供了新思路。
    至顶网  科技行者  2025-09-02 09:33:02  
  • 专访|DoorDash掌门人:从濒临倒闭到主宰美国外卖市场,如何缔造一个全新商业帝国

    DoorDash联合创始人兼CEO Tony Xu(徐讯)与YC董事长Garry Tan展开了一场关于创业精髓的访谈,讲述了公司的起源故事、公司如何在几次危机中幸存下来、以及如何改变整个行业。
    至顶网  周雅  2025-04-09 21:22:44  
  • 机器人也能拥有"人手"?北大团队让机器人学会人类灵巧动作的秘密武器

    北大团队突破性研究Being-H0系统,首次实现让机器人通过观看人类视频学习灵巧手部动作。该系统采用"物理指令调优"方法,在150万个动作样本上训练,达到毫米级精度,在多项复杂操作测试中成功率达60%-100%,仅需传统方法25%的训练数据。这项技术为医疗、制造和服务业机器人应用开辟新前景。
    至顶网  科技行者  2025-07-25 11:46:24  
  • 麻省理工学院突破性研究:教机器像人类一样理解物体的三维世界

    麻省理工学院研究团队开发出突破性的三维场景理解技术,让机器能够像人类一样理解复杂的三维空间。该技术采用分层空间表示和多模态数据融合,在场景重建准确率上达到92.3%,平均定位误差仅2.1厘米。这项技术将广泛应用于机器人、自动驾驶、AR/VR等领域,为人工智能的空间理解能力带来重大突破。
    至顶网  科技行者  2025-08-25 10:26:08  
  • 突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"

    西湖大学研究团队发表突破性论文,提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上,同时保持90%以上的准确率,有望解决当前AI系统"记忆不够用"的核心问题,为智能手机、医疗影像、自动驾驶等领域带来重大突破。
    至顶网  科技行者  2025-08-04 13:34:06  
  • 阿联酋研究团队打造AI"读心术":从照片和文字中破解人格密码

    阿联酋研究团队创建了PersonaX数据库,包含超过1.3万人的多模态性格分析数据。通过整合面部照片、背景信息和AI生成的行为特征描述,研究首次实现了大规模的跨模态性格分析。团队开发的双层分析框架不仅能发现统计关联,还能揭示深层因果关系,为理解人类性格特征提供了全新视角。
    至顶网  科技行者  2025-09-26 13:57:07  
  • 机器也会做白日梦?麻省大学让AI学会"脑补"进行推理

    这项研究提出了Mirage框架,让AI学会像人类一样进行"心理想象"推理。通过生成压缩的潜在视觉标记而非完整图像,该方法在多个空间推理任务上显著超越传统文字推理和图像生成方法,为AI推理能力发展开辟了新路径。
    至顶网  科技行者  2025-06-26 09:39:49  
  • CityLens:清华等机构研发城市图像分析基准,评估大型语言-视觉模型的城市社会经济感知能力

    CityLens是清华大学和北京交通大学联合开发的基准测试系统,旨在评估大型语言-视觉模型通过城市图像预测社会经济指标的能力。研究团队构建了一个覆盖17个全球城市的多模态数据集,包含经济、教育、犯罪、交通、健康和环境六大领域的11项指标。通过直接指标预测、归一化指标估计和基于特征的回归三种评估方法,他们测试了17种最先进的大型语言-视觉模型。结果表明,虽然这些模型展示了有希望的感知和推理能力,但在准确预测城市社会经济指标方面仍有明显局限。
    至顶网  科技行者  2025-06-06 11:21:31  
  • 语音识别遇上"扩散大脑":剑桥-清华-伊利诺伊团队让机器听得更准确

    这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。
    至顶网  科技行者  2025-10-09 14:35:08  
  • cadrille:基于在线强化学习的多模态CAD重建技术

    AIRI研究院团队开发的cadrille是一款突破性多模态CAD重建模型,能同时处理点云、多视角图像和文本描述输入,并生成精确的Python代码来构建CAD模型。该研究首次将在线强化学习应用于CAD重建任务,采用两阶段训练策略:先在程序生成数据上进行监督微调,再通过在线反馈进行强化学习优化。实验结果显示,cadrille在DeepCAD基准测试中超越所有单模态方法,并在三个具挑战性数据集(包括真实世界CC3D)上创造新的最高记录,特别是在线强化学习技术GRPO显著优于离线替代方案。
    至顶网  科技行者  2025-06-04 09:15:32  
  • 伊利诺伊大学团队突破:让AI同时看懂和画出图像,速度提升6倍的革命性架构

    伊利诺伊大学研究团队提出LaTtE-Flow架构,创新性地将多模态理解和图像生成统一在单一模型中。通过层级时间步专家和时间步条件残差注意力两大技术突破,实现6倍推理加速和4倍参数效率提升,同时保持高质量的图像生成和理解性能,为高效多模态AI应用奠定基础。
    至顶网  科技行者  2025-06-19 10:46:22  
  • 人工智能学会了"无师自通":清华大学团队让AI在没有标准答案的情况下自我进化

    清华大学研究团队开发出TTRL技术,让AI无需标准答案即可自我学习。通过"多数投票"机制,AI分析自己的多个解答找出最佳答案并以此改进。在数学竞赛中表现卓越,AIME 2024正确率提升159%。这种"无师自通"能力标志着AI向真正自主智能迈进的重要突破。
    至顶网  科技行者  2025-07-17 09:26:40  
  • 芝加哥大学赵燕斌:我们做的是让AI看不见的“艺术”

    当AI正在经历"摩尔式"狂奔时,我们比以往任何时候都更应思考,如何确保技术进步不会侵蚀文艺创作这一人类文明的珍贵财富。这不仅关乎技术的未来,更关乎人类文化传承的根本。
    至顶网  王聪彬  2025-04-30 10:01:25  
  • 谷歌破解大型系统性能预测难题:用AI读懂复杂系统日志,让传统方法望尘莫及

    谷歌联合康奈尔大学等机构的研究团队开发出革命性的"文本到文本回归"方法,让AI直接阅读系统日志预测性能,在谷歌Borg集群上达到0.99的预测准确率,比传统方法精确100倍,将预测时间从18小时缩短至几秒钟。
    至顶网  科技行者  2025-07-02 10:59:12  
  • Yale研究团队突破传统:Table-R1开创表格推理的全新境界

    Yale大学自然语言处理实验室研发的Table-R1模型突破性地将推理时间缩放技术应用于表格推理任务。研究团队通过两种方法提升模型能力:从DeepSeek-R1模型的推理过程中学习,以及利用可验证奖励进行强化学习。实验表明,即使使用仅有7B参数的模型,Table-R1-Zero也能在13个表格推理基准测试中媲美甚至超越GPT-4.1等大型模型。该研究不仅证明了中小规模模型通过适当训练也能实现出色表现,还为数据分析、科学研究和决策支持系统等实际应用提供了新可能。
    至顶网  科技行者  2025-06-03 17:39:47  
  • IBM研究院揭秘:当AI助手遇到"狡猾"用户,政策防线为何轻易失守?

    IBM研究团队通过CRAFT系统揭示AI助手在面对恶意用户时的脆弱性。该研究发现,即使最先进的AI助手在遭遇精心设计的诱导攻击时,政策违反率高达70%,远超传统攻击方法。团队开发的τ-break测试集专门评估AI在政策遵守方面的表现,结果显示现有防御措施效果有限。这项研究为AI安全评估提供了新视角,强调需要考虑恶意用户场景,对未来AI系统的安全部署具有重要指导意义。
    至顶网  科技行者  2025-06-19 12:54:06  
  • 上海人工智能实验室最新突破:让AI模型拥有"视觉记忆",解决长文本中图片内容被遗忘的难题

    上海人工智能实验室提出CoMemo架构,通过双路径处理解决视觉语言模型在长文本中的图像遗忘问题。该方法结合上下文路径和记忆路径,配合RoPE-DHR位置编码,在七项任务中显著提升性能,为多模态AI的长上下文处理提供了新的解决方案。
    至顶网  科技行者  2025-06-24 13:50:00  
  • 让AI既能看人脸又能听声音:比利时和美国科学家的多感官"读心术"突破

    比利时蒙斯大学和美国南加州大学联合开发了Social-MAE,这是一个能够同时理解人脸表情和声音情感的AI系统。该系统通过分析8个连续视频帧和音频特征,在VoxCeleb2大型社交数据集上进行自监督学习,在情感识别、笑声检测和性格分析三项任务中均达到了业界最佳水平,为智能教育、医疗诊断、人机交互等领域开辟了新的应用前景。
    至顶网  科技行者  2025-09-05 10:12:02  
  • 华盛顿大学最新研究:我们终于能让家用机器人像人类一样优雅地完成日常任务了

    华盛顿大学研究团队开发出MUTEX系统,让家用机器人具备类人灵活性。该系统通过扩散策略和分层学习,使机器人能观察人类演示视频自主学习,在陌生环境中适应性完成复杂任务。测试显示成功率提升近一倍,动作更自然流畅。系统具备多任务协调、人机协作和安全保护功能,为未来智能家居和工业应用奠定基础。
    至顶网  科技行者  2025-06-13 09:45:36  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号