用了 0.088767秒,为您找到mg 性价比 最高 高达 網纸 YB233相关内容5940 条
  • VideoRefer套件:阿里达摩院让视频AI真正"看懂"复杂场景中的每个物体

    阿里达摩院联合浙江大学推出VideoRefer套件,这是首个能够精确理解视频中特定物体的AI系统。该系统不仅能识别整体场景,更能针对用户指定的任何物体进行详细分析和跨时间追踪。研究团队构建了包含70万样本的高质量数据集VideoRefer-700K,并设计了全面的评估体系VideoRefer-Bench。实验显示该技术在专业视频理解任务中显著超越现有方法,在安防监控、自动驾驶、视频编辑等领域具有广阔应用前景。
    至顶网  科技行者  2025-09-16 11:10:47  
  • 北加州大学突破性发现:在家用电脑上就能模拟海洋"龙卷风"!Python编程让复杂流体力学研究走进寻常百姓家

    这项研究开发了kh2d-solver,一个用Python编写的开源工具包,能在普通台式机上高效模拟海洋和大气中的开尔文-亥姆霍兹不稳定性。通过四个测试案例,研究发现双剪切层的混合效率比强迫湍流高2.8倍,挑战了传统认知。该工具大幅降低了复杂流体力学模拟的技术门槛,为科学计算民主化做出重要贡献。
    至顶网  科技行者  2025-10-15 12:07:43  
  • Time-R1: 让3B小模型也能拥有全面时间推理能力,击败671B大模型

    这项研究介绍了Time-R1,一个3B参数的语言模型,通过创新的三阶段强化学习训练方法,在时间推理能力上超越了参数量大200倍的模型。该框架依次建立了基础时间理解、未来事件预测和创意场景生成能力,采用精心设计的动态奖励系统指导学习过程。实验证明,小型高效模型通过专门训练可以在时间推理任务上实现卓越表现,为可扩展的时间感知AI提供了实用路径。研究团队还发布了Time-Bench数据集和模型检查点,促进该领域的进一步发展。
    至顶网  科技行者  2025-05-29 10:24:11  
  • Meta与卡内基梅隆大学携手打造ATLAS:让3D人体建模像调整游戏角色一样简单

    Meta与卡内基梅隆大学联合开发的ATLAS系统革命性地解决了3D人体建模中的核心难题。通过将人体骨架和表面分离处理,ATLAS实现了精确的独立控制,避免了传统方法中调整一个部位影响其他部位的问题。该系统基于60万高分辨率扫描数据训练,采用创新的稀疏非线性姿态校正技术,能从单张照片生成精确3D模型,为虚拟现实、游戏制作、在线购物等应用提供强大技术支撑。
    至顶网  科技行者  2025-10-11 09:53:34  
  • 斯坦福大学:机器人也能"听从内心声音",无需重新训练就能精准执行新任务

    斯坦福大学推出DynaGuide技术,让机器人无需重新训练就能通过视觉示例学会新任务。该系统采用独立的动态模型为机器人提供实时行为指导,成功率达70%,在处理模糊指令时比传统方法强5.4倍。技术支持多目标引导和即插即用部署,已在真实机器人上验证成功,为个性化机器人服务开辟新路径。
    至顶网  科技行者  2025-06-24 10:15:47  
  • AUTOMIND:清华浙大联手打造的"数据科学全自动大师",让AI学会像专家一样解决机器学习难题

    这项由浙江大学与蚂蚁集团联合研究的AUTOMIND系统,通过构建专家知识库、智能搜索策略和自适应编程三大创新,让AI具备了接近人类专家的数据科学能力。在权威测试中超越56.8%的人类参赛者,相比前代系统效率提升300%,成本降低63%,为数据科学自动化开辟了新路径。
    至顶网  科技行者  2025-07-07 17:29:28  
  • 字节跳动推出X-Streamer:让静态照片变身会聊天的数字人,实现无限时长实时对话

    字节跳动研究团队推出X-Streamer技术,首次实现从单张照片生成具有无限对话能力的数字人。该系统采用思考者-行动者双架构,统一处理文本、语音和视频生成,支持实时交互和长时间稳定对话。在双GPU配置下可达25fps生成速度,在多项指标上超越现有方法,为数字人技术的实际应用奠定了基础。
    至顶网  科技行者  2025-10-17 14:07:55  
  • ServiceNow推出音频大模型评估神器:AI语音助手测评从此不再头疼

    ServiceNow团队开发的AU-Harness是首个专门针对AI语音助手的综合评估工具包。该工具通过创新的并行处理和标准化测试协议,将评估效率提升127%,涵盖19项测试任务。研究引入了两个全新测试类别:时间感知的对话分离和复杂的口语推理能力。通过380多项测试揭示,当前AI语音模型在基础识别方面表现良好,但在复杂推理和时间理解上仍存在显著差距,为未来技术改进指明了方向。
    至顶网  科技行者  2025-09-25 14:40:53  
  • 数字化浪潮下的架构融合浅谈——中道为正、无问西东

    数字化转型其实是一个比较夹生的表达方式。虽然“数字化”对这一进程本质的揭示更为深刻和普适,但不可否认的是,以“互联网”为前缀的表达方式在逆袭正劲的风口,具有更高的市场辨识度。
    至顶网  业界供稿  2018-06-28 10:37:14  
  • 芯片设计的新武器:阿里云如何让AI帮工程师走出设计迷宫

    阿里云智能集团研究团队在《VLSI设计期刊》发表突破性研究,提出基于图神经网络的芯片布局优化框架。该技术将复杂芯片设计转化为图形网络问题,通过AI系统自动寻找最优布局方案。实验显示相比传统方法,功耗降低15-18%,设计效率显著提升,已在智能手机和服务器芯片项目中成功应用。
    至顶网  科技行者  2025-08-21 16:41:22  
  • 拍照文档歪歪扭扭?这套清华等顶尖院校联合开发的AI系统让文档瞬间变平整!

    这项由清华旗下奇虎科技等机构联合开发的研究,提出了ForCenNet前景中心网络来解决手机拍摄文档变形问题。与传统均匀处理方法不同,该系统重点关注文档中的关键信息区域如文字和表格线条,采用创新的前景分割、掩码引导和曲率一致性优化技术,在四个主流数据集上达到最优性能,为移动文档数字化提供了高效解决方案。
    至顶网  科技行者  2025-08-04 13:34:52  
  • 对话达观数据陈运文:我们在打破文本智能处理的“真空地带”

    陈运文34岁那年,是2015年,他离开任职多年的大厂,转而投身于“大众创业、万众创新”的时代浪潮中。从此,他成为达观数据董事长兼CEO,他的使命是“扛起国内文本智能处理ToB业务这面大旗”。
    至顶网  周雅  2022-09-20 10:25:54  
  • 柏林独立研究团队首次揭秘:如何让土耳其语AI真正"听懂"人话

    柏林独立研究团队发布首个土耳其语分词策略综合研究,系统比较了字符级、词汇级、形态学感知和WordPiece四种分词方法。研究发现32k-52k词汇表的WordPiece分词在多数任务中表现最优,而形态学感知分词在语法分析任务中效果更佳。团队开源了完整评估框架、预训练模型和基准测试,为土耳其语AI开发提供了实用指南。
    至顶网  科技行者  2026-02-11 13:05:00  
  • 微软发布Phi-4-Mini:3.8B参数的"小钢炮",多模态表现堪比大模型两倍体量

    微软发布Phi-4-Mini多模态语言模型,仅3.8亿参数却能媲美两倍规模模型性能。该模型采用创新"混合LoRA"技术,支持文本、图像、语音多模态输入,在数学推理、编程、语音识别等任务中表现出色,在OpenASR榜单排名第一。这种"小而精"设计理念为AI普及化提供新思路,使强大AI功能可在消费级设备运行。
    至顶网  科技行者  2025-08-04 10:00:34  
  • 让AI真正"看懂"并编辑图片:上海交大团队开创视觉推理新基准

    上海交大团队首次建立AI视觉推理评估标准RISEBench,测试发现即使最先进的GPT-4o-Image在推理驱动的图像编辑任务中准确率仅28.8%。研究涵盖时间、因果、空间、逻辑四大推理维度,揭示当前AI缺乏真正理解物理规律和逻辑关系的能力,为AI发展指明了从模式识别向深层推理转变的重要方向。
    至顶网  科技行者  2025-07-16 09:17:45  
  • 千人聚会、50万人围观,2024 AI创新者大会暨PEC·提示工程峰会顺利召开

    一句提示词,一个新世界。
    至顶网  金旺  2024-11-16 20:38:45  
  • 第五代至强“上新” 英特尔“拼出”完整AI产品“拼图”

    AI时代,英特尔需要重新引领产业风向,伴随着第五代英特尔至强可扩展处理器的发布,英特尔也进入了密集的产品发布周期。
    至顶网  李祥敬  2023-12-15 15:30:00  
  • AI也有自己的"内心OS"?科学家首次破解大模型推理思考的神秘机制

    俄罗斯人工智能研究院等机构的研究团队首次成功破解了大语言模型内部推理机制的奥秘。他们使用稀疏自编码器技术将AI模型复杂的内部状态分解成可理解的功能组件,并开发了ReasonScore评分系统来识别负责推理的特定组件。通过精确调节这些"推理组件",研究团队实现了AI推理能力的显著提升,为开发更可控、更透明的AI系统奠定了基础。
    至顶网  科技行者  2025-08-04 11:15:46  
  • AI也会"看脸色"了?南京大学团队让大语言模型学会了见机行事

    这项由南京大学团队开发的FASB技术让AI学会了"察言观色"和"知错能改"。通过实时监控AI内部状态并动态调整干预强度,该方法在多个测试中将AI回答准确率提升了近50%。研究团队创新性地引入了回退机制,让AI能在发现问题时"重新来过",显著提升了回答质量。该技术在教育、客服、内容创作等领域具有广阔应用前景。
    至顶网  科技行者  2025-09-03 12:28:34  
  • 华盛顿大学等机构重磅推出"锚定解码"技术,让AI模型彻底摆脱版权纠纷困扰

    华盛顿大学研究团队提出"锚定解码"技术,通过融合安全和危险AI模型的输出来降低版权侵权风险。该方法能在保持75%版权保护水平的同时维持高质量文本生成,为AI时代的版权问题提供了实用解决方案。
    至顶网  科技行者  2026-02-11 13:00:38  
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7  京ICP证161336号  京公网安备11010802021500号