搜索大发玩和值的稳定必中方法规【罔芷:——88pk·ee—

千人聚会、50万人围观，2024 AI创新者大会暨PEC·提示工程峰会顺利召开

一句提示词，一个新世界。

至顶网金旺 2024-11-16 20:38:45

Step1X-3D：迈向高保真度可控的三维资产生成新时代

如果把生成式AI的发展比作一场赛跑，那么文本、图像、音频和视频生成已经跑在了前头，而3D内容生成却明显落后，还远未达到可投入生产的成熟度。为什么会出现这种情况呢？研究团队通过深入分析，发现了三个关键瓶颈。

至顶网科技行者 2025-05-14 12:48:23

港科大联手快手：视频生成模型将彻底重塑游戏开发，每个人都能成为游戏设计师

香港大学、香港科技大学与快手科技联合发布开创性研究，提出用交互式生成视频（IGV）技术构建下一代游戏引擎，将彻底改变游戏开发模式。该技术能实时生成无限游戏内容，让每个人都能成为游戏设计师，解决传统游戏内容有限、成本高昂、缺乏个性化等根本问题，为游戏产业描绘了一个充满想象力的未来。

至顶网科技行者 2025-08-01 10:17:00

哈工大团队破解AI视觉幻觉难题：让机器不再"胡说八道"看图片

哈工大团队提出SENTINEL框架，通过句子级早期干预和交叉验证机制，将多模态AI的视觉幻觉率从52.7%降至4.3%，降幅超90%。该方法采用域内数据自举策略，无需外部标注，在保持AI通用能力的同时显著提升了图像描述准确性，为可信AI发展提供重要突破。

至顶网科技行者 2025-07-24 16:25:45

南大团队打造视频界的"3D地图"：2.7万小时海量视频数据集让AI看懂真实世界的空间关系

南京大学研究团队构建了SpatialVID，一个包含2.7万小时高质量视频的大规模空间标注数据集。该数据集为每个视频片段提供精确的摄像机姿态、深度信息、动态掩码和结构化语义描述，涵盖城市、自然、室内等多样场景。通过严格的四重筛选机制和创新的几何先验增强标注流程，SpatialVID在规模和质量上都创下新纪录，为训练具有空间理解能力的AI模型提供了前所未有的数据基础，将推动自动驾驶、机器人导航、虚拟现实等领域的技术进步。

至顶网科技行者 2025-09-12 16:49:02

我如何从三本到顶级金融外企

「老易说：“如果你羡慕大佬，那你自己就变成大佬。对抗恐惧最好的办法就是直面恐惧，就这么简单。”」

至顶网尼酱 2023-02-03 10:22:02

小公司如何训练出超越巨头的AI网络助手？香港科技大学团队的"探索进化"新方案

香港科技大学团队提出WebExplorer框架，通过"模型驱动探索"和"迭代查询演化"两阶段生成高质量训练数据，成功训练出80亿参数的WebExplorer-8B模型。该模型在多个信息搜索基准测试中超越了720亿参数的大型模型，支持长达100轮的工具调用和128K上下文长度，展现了开源AI在网络助手领域的突破潜力。

至顶网科技行者 2025-09-24 13:55:36

卢布尔雅那大学开发出"全能型"表面缺陷检测神器：一个模型搞定所有标注场景的工业检测难题

卢布尔雅那大学研究团队开发出SuperSimpleNet统一缺陷检测系统，能够适应无监督、弱监督、混合监督和完全监督四种学习场景。该系统在多个数据集上达到98%以上检测准确率，推理时间仅9.5毫秒，通过创新的合成异常生成技术和双分支架构设计，解决了传统方法只能处理特定标注类型的局限性，为工业质量检测提供了灵活高效的解决方案。

至顶网科技行者 2025-09-08 14:13:23

大语言模型的推理时间计算革命：如何让AI像人类一样慢慢思考

这是首个全面梳理AI深度思考技术的权威调研，由8所国际知名院校联合完成。研究建立了四维分析框架，系统阐述了让AI像人类一样慢慢思考的技术原理、实现方法、应用场景和评估标准，为这一革命性技术的发展与应用提供了完整的理论指导和实践路径。

至顶网科技行者 2025-07-15 11:35:05

上海AI实验室推出φ-Decoding：让AI在推理时学会"深思熟虑"的新方法

上海AI实验室等多所高校联合提出φ-Decoding方法，通过让AI在推理时进行前瞻性采样和智能剪枝，解决了传统自回归生成的短视性问题。该方法在多个推理任务上显著提升了大语言模型性能，平均改进超过14%，同时保持了6倍的计算效率优势，为推理时优化提供了实用的解决方案。

至顶网科技行者 2025-07-31 14:57:21

对话iRobot副总裁Hajime Hikino：如何理解未来的智能家居？

iRobot如何理解未来的智能家居？

至顶网周雅 2019-11-11 16:36:44

机器人学会"三重思考"：清华大学让机器人拥有了分层视觉理解能力

清华大学研究团队开发出H3DP系统，让机器人具备了类似人类的"三重分层思考"能力。该系统通过深度感知分层、多尺度视觉表征和分层动作生成三个层次，实现了视觉感知与动作执行的深度融合。在44个仿真任务中平均提升27.5%性能，在真实世界复杂操作中提升32.3%。这项技术为机器人在杂乱环境中的精确操作和家庭服务应用奠定了重要基础。

至顶网科技行者 2025-07-09 09:42:06

斯坦福大学等机构推出JavisDiT++：AI终于学会了同时生成有声有色的视频

这项由浙江大学等多所国际知名院校合作完成的研究，开发了名为JavisDiT++的AI系统，实现了高质量音视频同步生成的重大突破。该系统采用独创的模态特异性专家混合架构和时间对齐位置编码技术，仅用100万训练样本就在多项指标上全面超越现有开源方法，并首次将人类偏好优化引入音视频生成领域。

至顶网科技行者 2026-02-27 11:23:40

星际创想实验室发布Spacer：让AI也能迸发科学灵感的突破性系统

星际创想实验室发布突破性AI系统Spacer，通过"故意去语境化"技术让人工智能具备科学创新能力。系统由关键词挖掘引擎Nuri和概念生成管道组成，能从18万篇论文中发现新研究方向。验证显示其预测准确率达73.7%，概念重构成功率超85%，生成想法更接近顶级科学研究。

至顶网科技行者 2025-09-03 11:37:53

打破语言和视觉边界：斯图加特团队创造首个跨语言多模态AI测试基准

这项由意大利布鲁诺·凯斯勒基金会等机构联合完成的研究创建了首个跨语言多模态AI评测基准MCIF，涵盖英德意中四种语言，包含文字、语音、视频三种模态和13项任务。通过对21个先进AI模型的测试，发现AI在长文本处理、跨模态融合和指令鲁棒性方面存在显著不足，为AI技术改进指明了方向。

至顶网科技行者 2025-08-07 11:11:08

蚂蚁集团发布UI-Venus-1.5：手机和网页操作再也不用亲自动手？

蚂蚁集团发布的UI-Venus-1.5是一个能够自动操作手机和网页界面的AI系统。它通过创新的四阶段训练方法，实现了从多个专门模型到统一模型的突破，在多项权威测试中达到70%以上的成功率，特别针对40多个中国主流应用进行了优化，展现了AI助手在真实场景中的应用潜力。

至顶网科技行者 2026-02-11 15:54:35

风电场的"智能医生"：如何让风力发电机更聪明地预测故障

本研究通过访谈五位风电专业人士，发现预测维护模型虽能有效减少重大故障停机时间约20%，但在识别渐进性小故障方面存在不足，同时面临假阳性、传感器可靠性和新旧系统整合等挑战。数字孪生、SCADA系统等先进技术显著提升了运维效率，但仍需在AI算法优化、实时数据整合等方面持续改进。

至顶网科技行者 2025-06-30 10:51:53

波兰研究团队揭秘：为什么聪明的AI大模型会被几个错别字轻松"骗倒"？

波兰研究团队发现，即使是最先进的AI大模型在处理波兰语等非主流语言时也极其脆弱，仅通过几个拼写错误或字符替换就能让AI做出错误判断。研究团队开发了一套巧妙的测试框架，使用小型代理模型找出关键词汇，然后对这些词汇进行十种不同的"伪装攻击"。实验结果显示，这些简单攻击能让先进AI模型的错误率飙升至48%以上，揭示了当前AI技术在多语言安全方面的严重漏洞。

至顶网科技行者 2025-06-13 08:02:53

当照片"有洞有残缺"时，AI也能巧手补天：北京大学团队让3D重建告别"马赛克"困扰

GSFixer是由北京大学等机构联合开发的3D重建技术，专门解决从稀少照片中重建高质量3D模型的难题。该技术通过参考引导的视频扩散模型，融合2D语义和3D几何信息，确保生成的新视角与原始照片保持一致性。相比现有方法在图像质量和结构准确性方面都有显著提升，可广泛应用于文物保护、房地产、影视游戏等领域。

至顶网科技行者 2025-08-18 13:58:33

“早上ICU，晚上KTV”：MiniMax研究员讲述开放模型背后的工程暗战

Turing Post频道最近发布了一期与MiniMax高级研究员Olive Song的深度对话，这也是西方媒体首次对MiniMax研究团队的一对一访谈。对话录制于1月底一个周日晚上九点，当时Olive正在等待新一轮模型实验的结果。两周后，MiniMax在马年春节档投下重磅炸弹。

至顶网周雅 2026-02-18 16:08:21