搜一下
用了 0.006799秒,为您找到
网上
厉害
回血
导师
相关内容255 条
让机器真正学会"看图说话":腾讯AI实验室破解视觉语言模型的"偷懒"难题
腾讯AI实验室联合多所大学开发出Vision-SR1方法,通过"观察-描述-验证"的训练策略解决视觉语言模型的两大问题:依赖文字线索猜答案的"语言捷径"和描述不存在内容的"视觉幻觉"。该方法要求AI先详细描述图片内容,再仅凭描述回答问题,强化真实视觉理解能力。实验显示在多个测试集上效果显著提升,为开发更可靠的AI视觉系统提供重要技术基础。
至顶网
科技行者 2025-09-03 14:09:40
微软研究院重磅发布:MineWorld让你在Minecraft里实时玩转AI世界,速度快到让职业玩家都惊呆!
微软研究院开发的MineWorld是首个开源实时交互式游戏AI世界模型,专门针对Minecraft设计。该系统使用创新的并行解码算法,实现每秒4-7帧的超快生成速度,能够跟上职业电竞选手的操作节奏。系统不仅能生成高质量游戏画面,更重要的是真正理解玩家操作含义,甚至具备自主游戏能力。研究团队设计了全新的评测体系来衡量AI的理解能力,并将所有代码开源,为游戏AI领域树立了新标杆。
至顶网
科技行者 2025-07-14 14:37:59
专访DeepMind CEO:我们距离实现AGI只需5-10年
DeepMind创始人兼首席执行官Demis Hassabis(德米斯·哈萨比斯),在达沃斯论坛期间,分享了多个重磅消息。
至顶网
周雅 2025-01-23 23:58:22
专访DeepMind CEO:我们距离实现AGI只需5-10年
DeepMind创始人兼首席执行官Demis Hassabis(德米斯·哈萨比斯),在达沃斯论坛期间,分享了多个重磅消息。
至顶网
周雅 2025-01-23 23:56:42
滑铁卢大学科学家发明神奇AI:仅凭声音就能生成开口说话的逼真视频
这项研究展示了一种革命性的AI技术,能够仅通过音频生成高度逼真的说话视频。滑铁卢大学研究团队开发的Audio2Photoreal系统巧妙结合了深度学习、扩散模型等先进技术,实现了声音到面部动作的精准转换。该技术在影视制作、在线教育、新闻媒体等领域具有广阔应用前景,将大幅降低视频制作成本和门槛。虽然仍面临计算资源需求高、隐私安全等挑战,但其突破性创新为未来视频内容创作开辟了全新路径。
至顶网
科技行者 2025-08-27 10:31:20
元年科技:打造数字化转型的核心引擎——首款世界级国产内存多维数据库炼成记!
从管理会计到财务数字化,再到数字化转型,不断扩展的市场空间让北京元年科技股份有限公司,这家以专业、专注著称的科技公司进入到一个快速发展的新阶段。
至顶网
元年 2022-09-22 10:04:03
特种兵退役后,我成了一名程序员
武装泅渡、在炮弹中腾挪跳跃的特种兵,与指尖跳跃,在办公室创造虚拟世界的程序员,就像两条毫不相干的平行线,但命运却令两条线交缠。当两种身份印记融汇进同一人的人生故事里,又会谱写怎样的故事呢?
至顶网
尼酱 2022-07-13 11:55:35
我如何从三本到顶级金融外企
「 老易说:“如果你羡慕大佬,那你自己就变成大佬。对抗恐惧最好的办法就是直面恐惧,就这么简单。”」
至顶网
尼酱 2023-02-03 10:22:02
Meta CFO 苏珊·李:从19岁华尔街分析师到Fortune 100最年轻CFO,17年见证扎克伯格的领导力变化与AI转型
Meta以1亿美元天价争夺AI人才之际,CFO苏珊·李揭秘资本配置艺术:"当扎克伯格一年烧掉600亿建设AI时,我的工作不仅是算清每笔账,更要向骂街的投资者证明——疯狂支出终有回报。"这位19岁闯华尔街的财务奇才,用17年见证了Meta从社交媒体到AI巨头的蜕变。
至顶网
至顶AI实验室 2025-07-01 17:55:21
波兰研究团队揭秘:为什么聪明的AI大模型会被几个错别字轻松"骗倒"?
波兰研究团队发现,即使是最先进的AI大模型在处理波兰语等非主流语言时也极其脆弱,仅通过几个拼写错误或字符替换就能让AI做出错误判断。研究团队开发了一套巧妙的测试框架,使用小型代理模型找出关键词汇,然后对这些词汇进行十种不同的"伪装攻击"。实验结果显示,这些简单攻击能让先进AI模型的错误率飙升至48%以上,揭示了当前AI技术在多语言安全方面的严重漏洞。
至顶网
科技行者 2025-06-13 08:02:53
PLADIS:三星研究院用稀疏注意力机制让AI画图更懂你说的话
三星研究院提出PLADIS技术,通过稀疏注意力机制显著提升AI绘画的文字理解准确性。该方法无需重训练模型,仅在推理阶段替换注意力计算函数,就能让AI更精准理解用户描述,生成更符合要求的图像。实验显示图像质量提升20%,文字匹配度大幅改善,且兼容各种现有AI绘画系统。
至顶网
科技行者 2025-08-04 09:58:23
ByteDance Seed团队突破AI数学难题:让机器像顶尖数学家一样证明定理
字节跳动种子团队开发出突破性AI数学证明系统BFS-Prover-V2,通过创新的多智能体协作和自适应训练方法,在MiniF2F测试中达到95.08%成功率,在ProofNet测试中达到41.4%成功率,展现出接近顶尖数学家的证明能力。该系统采用"规划师-证明者"分工协作模式,能够将复杂数学定理分解为简单子目标,并通过动态重规划机制灵活应对困难问题,为AI复杂推理能力树立了新标杆。
至顶网
科技行者 2025-09-19 11:04:45
从印地语到英式口音,人工智能让语音生成告别"一口一个味"——孟买工程学院突破多语言情感语音合成
孟买工程学院研究团队开发出突破性的多语言情感语音合成系统,能实现印地语与英语间的实时口音切换,同时准确表达多种情感。该系统在口音准确性上提升23.7%,情感识别准确率达85.3%,为南亚地区教育技术和无障碍软件应用开辟新道路。
至顶网
科技行者 2025-06-25 14:54:05
TVP尖峰对话李开复、沈春华:AI 未来式与技术的发展、价值
5月8日晚,腾讯云TVP尖峰对话李开复,浙江大学教授、腾讯优图实验室高级顾问、杰出科学家沈春华,第四范式副总裁、腾讯云 TVP 郑曌担任主持,邀请了 50 位来自 AI 领域的 CTO 与技术专家参与论坛讨论,碰撞出关于 AI 的未来火花。
至顶网
业界供稿 2022-05-23 13:38:57
多模态AI学会了自己"动手":清华、科大携手Kwai发布会自主编程处理图像的智能助手
清华、中科大联合Kwai团队开发的Thyme系统实现了多模态AI的重大突破,让AI模型具备了自主编写代码处理图像和进行数学计算的能力。通过创新的两阶段训练策略和GRPO-ATS算法,Thyme在近20个评测基准上都表现出显著性能提升,特别是在高分辨率图像处理和复杂推理任务中表现突出,代表了AI从被动"看图说话"向主动"动手解决问题"的重要转变。
至顶网
科技行者 2025-08-19 12:35:48
微软亚洲研究院发布HeurAgenix:让AI自己学会解决超级难题的全新框架
微软亚洲研究院发布HeurAgenix框架,首次实现让大型语言模型自动进化和选择算法来解决组合优化难题。该系统通过对比学习机制让AI自主发现改进策略,并开发轻量级选择模型在保持性能的同时大幅降低成本。在五大经典问题测试中表现卓越,为传统需要专家手工设计的优化问题提供了自动化解决方案。
至顶网
科技行者 2025-07-01 12:18:00
为什么它成了人类的“神器”?
如果我有“机器猫”,我要叫他“小叮当”,竹蜻蜓、任意门和时光机能去任何的地方。
至顶网
赛博故事(cybergushi) 2019-12-08 23:38:03
哈工大和360研究团队突破AI"偷懒思维":让人工智能真正听懂复杂指令的秘密武器
哈工大和360研究团队联合开发了Light-IF框架,成功解决了大型语言模型在处理复杂指令时的"偷懒思维"问题。该框架通过教AI学会"预览和自检"的工作方式,显著提升了AI对多重约束条件任务的处理能力。Light-IF-32B模型在四个权威测试平台上均取得最佳成绩,超越了多个知名大型模型。研究团队已开源相关模型和代码,为AI助手的发展开辟了新方向。
至顶网
科技行者 2025-08-11 14:31:04
从黄仁勋CES全程高能演讲,看英伟达庞大AI棋局:物理AI、AI PC、通用机器人
黄仁勋在会后接受包括至顶科技在内的媒体采访时所说:“英伟达只做两类事情:要么是别人没在做的,要么是我们能做得独特且更好的。”
至顶网
周雅 2025-01-15 15:34:37
从黄仁勋CES全程高能演讲,看英伟达庞大AI棋局:物理AI、AI PC、通用机器人
黄仁勋在会后接受包括至顶科技在内的媒体采访时所说:“英伟达只做两类事情:要么是别人没在做的,要么是我们能做得独特且更好的。”
至顶网
周雅 2025-01-08 19:26:21
<
上一页
7
8
9
10
11
12
13
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号