用了 0.109500秒,为您找到宝马 棋牌 官方网站 全部 版本 網纸 YB233相关内容6827 条
  • 复旦大学推出BMMR数据集:让AI跨越知识鸿沟,从数学天才走向通识博士

    复旦大学团队发布BMMR数据集,这是首个大规模跨学科多模态推理评估基准,包含11万个涵盖300个学科的大学水平问题。研究发现即使最先进的AI模型在跨学科推理中表现有限,揭示了当前AI发展的重要盲点。该数据集支持中英双语,配备专门的推理过程评估工具,为AI向通用智能发展提供重要支撑。
    至顶网  科技行者  2025-07-11 10:15:30  
  • 印度裔创业者视角:Perplexity创始人谈技术迭代、开源竞争与搜索革命

    最近我们留意到,阿拉温德在哈佛商学院2025创业峰会上,与Xfund管理合伙人Patrick Chung有一场深度对话,他大谈创业心得。从印度的电气工程学生,到改变搜索引擎格局的CEO,阿拉温德的故事提醒我们,在技术领域,最具变革性的创新,往往来自于能够跨越学术与商业鸿沟之处。
    至顶网  周雅  2025-04-26 22:37:21  
  • 南京大学团队破解了图数据分析的最大难题:如何让AI在超大规模网络中找到隐藏的群体模式

    这项由南京大学和蚂蚁集团合作的研究开发了PyAGC基准平台,解决了图聚类算法无法处理工业级大规模数据的难题。研究团队构建了统一的理论框架,开发了小批量训练技术,并建立了包含12个数据集的全面测试体系,成功实现了对1.11亿节点网络的高效处理,为图聚类技术的产业化应用铺平道路。
    至顶网  科技行者  2026-02-12 13:31:24  
  • NVIDIA发布Nemotron Nano 2:小身材大智慧,让AI推理速度飞跃6倍

    NVIDIA发布Nemotron Nano 2混合AI模型,采用创新的Mamba-Transformer架构,在保持90亿参数规模的同时,实现了比同类模型3-6倍的推理速度提升。该模型在数学、科学、编程等复杂推理任务上表现出色,支持15种语言,能在单GPU上处理12.8万字符长文本,为高效AI应用开辟了新路径。
    至顶网  科技行者  2025-09-09 10:35:07  
  • 智谱GLM-5技术曝光,代码能力已经赶上Claude?

    智谱GLM-5技术曝光,代码能力已经赶上Claude?
    至顶网  至顶AI实验室  2026-02-24 15:06:39  
  • NVIDIA与CMU联合开发:让AI像写文章一样理解视频,一个模型搞定所有视频任务

    NVIDIA联合CMU等机构开发了AUSM通用视频分割模型,首次将语言模型思路引入视频理解,用一个模型统一处理各种视频任务。该模型采用创新的并行训练策略,训练速度提升2.5倍,在七个权威数据集上均达到领先水平。AUSM突破了传统方法需要针对不同任务训练专门模型的限制,为视频AI应用提供了更简洁高效的解决方案。
    至顶网  科技行者  2025-09-02 16:02:19  
  • 澳门大学:图像生成也要"精益求精",AI学会自我优化条件信息

    澳门大学研究团队针对自回归图像生成中的条件错误累积问题,提出了基于最优传输理论的创新解决方案。研究发现自回归模型具备自我纠错能力,条件错误影响呈指数衰减,但仍存在"条件不一致"问题。团队创新性地运用瓦瑟斯坦梯度流方法优化条件信息,在ImageNet数据集上取得显著性能提升,为AI图像生成质量控制开辟了新方向。
    至顶网  科技行者  2026-02-12 13:32:13  
  • ShanghaiTech大学最新成果:让3D模型像变形金刚一样自动分解,一键实现爆炸图生成

    ShanghaiTech大学研究团队开发了BANG系统,能让3D模型像变形金刚一样自动分解成零部件,生成爆炸图。该系统采用"生成式爆炸动力学"技术,通过AI深度学习理解物体结构逻辑,实现从完整到分解的平滑过渡。相比传统表面分割方法,BANG能处理内部结构,生成完整体积部件,处理速度提升8倍以上。系统支持语言控制和2D交互,可应用于3D打印、教育展示、产品设计等领域,为3D智能应用开创新范式。
    至顶网  科技行者  2025-08-06 11:07:46  
  • 首次实现真正意义上的"图像记忆":希伯来大学突破3D生成技术瓶颈

    希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
    至顶网  科技行者  2025-09-01 16:00:03  
  • 东京大学团队突破视角局限:第一次让机器同时用"我的眼睛"和"他人的眼睛"看世界

    这是首个系统性探索跨视角协作智能的综合性研究,由南京大学、东京大学等顶尖机构联合完成。研究团队首次将"第一人称视角"与"第三人称视角"的协作应用进行了全面梳理,提出了三大技术方向和十三个关键任务,涵盖从智能厨房到手术机器人的八大应用场景。这项突破性工作为人工智能向人类认知迈进提供了重要的技术路径和理论基础。
    至顶网  科技行者  2025-06-10 14:21:14  
  • 价值引导搜索:提升推理模型思维链的高效指南——康奈尔大学研究团队的突破性成果

    康奈尔大学研究团队提出了"价值引导搜索"方法,通过训练标记级价值模型来优化大型语言模型的推理过程。他们收集了250万个数学推理轨迹,训练了15亿参数的评估模型,实现了基于块的高效搜索。这种方法不需要预定义"步骤"概念,也无需昂贵的每步标注。在四个数学竞赛基准测试中,该方法使DeepSeek-1.5B模型达到了45.7%的平均准确率,与更大模型相当,同时显著减少了计算资源需求。研究团队开源了数据集、模型和代码,为高效人工智能推理提供了新范式。
    至顶网  科技行者  2025-05-29 12:03:07  
  • 普渡大学研究团队突破:让人工智能"看见"物体真实大小的神奇方法

    普渡大学研究团队开发的深度平衡正则化器(DEC)解决了AI模型在处理不同大小物体时判断不一致的问题。该方法基于单调缩放群理论,通过潜在空间正则化显著提升了ViT、Swin等模型的尺度一致性和整体准确率,在ImageNet等数据集上表现优异,为自动驾驶、医疗图像分析等应用提供更可靠的视觉识别能力。
    至顶网  科技行者  2025-08-28 11:11:19  
  • 埃因霍芬理工大学团队用AI"擦拭"心脏超声影像的技术突破

    荷兰埃因霍芬理工大学研究团队开发出一种智能心脏超声除雾技术,能够自动识别图像中被"雾霾"污染的区域并进行有针对性清理。该技术结合语义分割和扩散模型,首先让AI识别心脏各部分结构,然后根据不同区域特点采用不同强度的除雾处理,在国际挑战赛中表现优异,为解决心脏超声图像质量问题提供了新思路。
    至顶网  科技行者  2025-09-02 09:33:02  
  • 谷歌DeepMind团队突破性成果:用噪声训练AI模型,让图像生成效率提升数倍

    谷歌DeepMind提出的统一潜变量框架通过在潜在表示中加入固定噪声,统一训练编码器、先验模型和解码器,实现了图像生成训练效率的显著提升。该方法在ImageNet-512上达到1.4的FID分数,在Kinetics-600上创造1.3的FVD新纪录,为AI图像和视频生成提供了更科学可控的理论基础和实现路径。
    至顶网  科技行者  2026-02-24 15:53:32  
  • 这45个场景,正在被区块链抽筋扒皮…

    在不少中国的投资人和合作伙伴们的眼中,这是个落地的好项目。其母公司AitherCO2,已经在欧洲和北美耕耘八年,通过节能改造,帮助2000个客户节省超过7亿美元的能源开支。
    至顶网  业界供稿  2018-11-20 11:48:59  
  • 机器人也能拥有"人手"?北大团队让机器人学会人类灵巧动作的秘密武器

    北大团队突破性研究Being-H0系统,首次实现让机器人通过观看人类视频学习灵巧手部动作。该系统采用"物理指令调优"方法,在150万个动作样本上训练,达到毫米级精度,在多项复杂操作测试中成功率达60%-100%,仅需传统方法25%的训练数据。这项技术为医疗、制造和服务业机器人应用开辟新前景。
    至顶网  科技行者  2025-07-25 11:46:24  
  • 万字梳理中国AIGC产业峰会激辩,大模型应用最全行业参考在此

    在中国AIGC产业峰会的现场,20位大咖展开激辩。从软件应用、智能终端乃至具身智能等,AIGC正在全面席卷,「你好,新应用!」成为本届AIGC峰会主题。
    至顶网  业界供稿  2024-04-19 16:56:56  
  • 机器人不再机械:上海交通大学联合多机构破解机器人动作不连贯难题

    上海交通大学联合多机构开发出Legato技术,解决了机器人动作不连贯的核心问题。该技术通过在训练阶段教会机器人保持动作连贯性,避免了传统机器人在动作切换时的停顿和突变。实验显示,使用Legato的机器人任务完成时间减少约10%,动作流畅度显著提升,为未来更自然的人机交互奠定了重要基础。
    至顶网  科技行者  2026-02-26 09:47:02  
  • 语音识别遇上"扩散大脑":剑桥-清华-伊利诺伊团队让机器听得更准确

    这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。
    至顶网  科技行者  2025-10-09 14:35:08  
  • cadrille:基于在线强化学习的多模态CAD重建技术

    AIRI研究院团队开发的cadrille是一款突破性多模态CAD重建模型,能同时处理点云、多视角图像和文本描述输入,并生成精确的Python代码来构建CAD模型。该研究首次将在线强化学习应用于CAD重建任务,采用两阶段训练策略:先在程序生成数据上进行监督微调,再通过在线反馈进行强化学习优化。实验结果显示,cadrille在DeepCAD基准测试中超越所有单模态方法,并在三个具挑战性数据集(包括真实世界CC3D)上创造新的最高记录,特别是在线强化学习技术GRPO显著优于离线替代方案。
    至顶网  科技行者  2025-06-04 09:15:32  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号