搜索宝宝计划手机版软件【網纸——YB233典CN—

拍照文档歪歪扭扭？这套清华等顶尖院校联合开发的AI系统让文档瞬间变平整！

这项由清华旗下奇虎科技等机构联合开发的研究，提出了ForCenNet前景中心网络来解决手机拍摄文档变形问题。与传统均匀处理方法不同，该系统重点关注文档中的关键信息区域如文字和表格线条，采用创新的前景分割、掩码引导和曲率一致性优化技术，在四个主流数据集上达到最优性能，为移动文档数字化提供了高效解决方案。

至顶网科技行者 2025-08-04 13:34:52

对话达观数据陈运文：我们在打破文本智能处理的“真空地带”

陈运文34岁那年，是2015年，他离开任职多年的大厂，转而投身于“大众创业、万众创新”的时代浪潮中。从此，他成为达观数据董事长兼CEO，他的使命是“扛起国内文本智能处理ToB业务这面大旗”。

至顶网周雅 2022-09-20 10:25:54

斯坦福大学推出SMMILE：首个医学AI在情境学习能力评估基准，揭示现有AI在医疗诊断中的致命弱点

这项研究汇集了来自斯坦福大学、苏黎世联邦理工学院、隆德大学、加州大学旧金山分校等多所世界顶尖学府的11位医学专家，共同构建了医学AI领域的首个多模态情境学习评估标准。

至顶网科技行者 2025-07-02 10:59:36

清华大学团队让AI动画角色随心所欲变身：从人类到恐龙，只需几个动作示例

清华大学和香港大学团队开发的Motion2Motion技术突破了动画制作中的动作转移难题，通过稀疏对应和动作片段匹配机制，实现了不同身体结构角色间的智能动作转移。该系统无需GPU设备即可实时运行，仅需少量示例和关键对应关系就能生成自然协调的动作，为游戏开发、影视制作等领域提供了革命性的创作工具。

至顶网科技行者 2025-08-27 15:13:11

千人聚会、50万人围观，2024 AI创新者大会暨PEC·提示工程峰会顺利召开

一句提示词，一个新世界。

至顶网金旺 2024-11-16 20:38:45

上海人工智能实验室发布OmniWorld：首个专为4D世界建模打造的大规模多领域数据集

上海人工智能实验室发布OmniWorld，这是首个专为4D世界建模设计的大规模多领域数据集。该数据集包含超过3亿帧数据，涵盖游戏、机器人、人类活动等多个领域，配备深度、相机位置、文本等多种标注。研究证明现有AI模型在复杂时空理解方面存在局限，而使用OmniWorld微调后性能显著提升，为自动驾驶、机器人、虚拟现实等应用发展奠定基础。

至顶网科技行者 2025-09-28 11:00:31

AI也会"看脸色"了？南京大学团队让大语言模型学会了见机行事

这项由南京大学团队开发的FASB技术让AI学会了"察言观色"和"知错能改"。通过实时监控AI内部状态并动态调整干预强度，该方法在多个测试中将AI回答准确率提升了近50%。研究团队创新性地引入了回退机制，让AI能在发现问题时"重新来过"，显著提升了回答质量。该技术在教育、客服、内容创作等领域具有广阔应用前景。

至顶网科技行者 2025-09-03 12:28:34

得与失——一位程序员的创业之路

每一个程序员的心中或许都有这样一个梦：有一天，做出一个心中的完美产品，让全世界的人使用它。蒋南国和他的合伙人创业七载，经历了无数的风风雨雨。作为一个技术合伙人，当拥有了对产品的决策权，他是否实现了自己的梦想，又会遭遇哪些坎坷？

至顶网尼酱 2022-06-28 10:58:46

南洋理工大学团队开发FastMesh：3D建模革命让艺术家梦想照进现实

FastMesh是新加坡南洋理工大学开发的革命性3D网格生成技术，通过分离处理顶点和面片，将传统方法的标记数量减少到23%，实现8倍速度提升。该技术采用自回归模型生成顶点，用双向变换器构建面片，并配备保真度增强器优化细节质量。在标准测试中表现优异，生成1000顶点模型仅需7秒，为游戏、影视、VR等行业提供了高效的3D内容创作解决方案。

至顶网科技行者 2025-10-10 13:58:07

瑞士AI联盟发布全球首个真正开源的大型语言模型：Apertus如何用15万亿字符数据改写AI训练规则

瑞士AI联盟发布全球首个真正开源的大型语言模型Apertus，在15万亿字符、1811种语言数据上训练。该模型采用创新的"金鱼损失"技术防止逐字记忆，严格遵循数据合规标准，提供80亿和700亿参数版本。研究团队完全公开训练代码、数据处理脚本等所有技术细节，树立了透明、可信赖的AI开发新标准。

至顶网科技行者 2025-10-13 08:56:53

ArtifactsBench：腾讯混元团队重新定义AI代码生成评测标准，让机器写出真正能看能用的界面程序

腾讯混元团队推出ArtifactsBench，这是全球首个专门评测AI生成视觉交互代码质量的综合基准系统。该系统包含1825个真实应用场景测试任务，创新性地通过实际运行代码、动态截图、多模态AI评委等方式，从功能性、美观度、用户体验等十个维度进行评测。实验结果显示其与人类专家判断一致性超过90%，与业界金标准WebDev Arena的一致性达94.4%，为AI代码生成能力评估树立了新标准。

至顶网科技行者 2025-07-11 10:13:36

斯坦福和伯克利联手出招：AI能看出你动作哪里不标准了！

斯坦福和伯克利研究团队推出VidDiff技术，让AI学会像专业教练一样精准识别动作差异。该技术通过三步走方法解决视频动作比较难题，构建了包含549对视频的大型数据集VidDiffBench。虽然当前AI模型准确率有限，但已展现在健身指导、医学培训、体育分析等领域的应用潜力。研究为AI理解细微动作差异开辟新方向，有望让人人享有智能化的动作指导。

至顶网科技行者 2025-07-30 09:51:47

纽约大学团队重新定义机器人学习：用"接触点"替代语言指令，让机器人更懂物理世界

纽约大学等多家机构联合研究提出了接触锚定策略，用物理接触点替代语言指令来训练机器人。该方法仅用23小时演示数据就实现了抓取、开启和关闭三种基本操作，在零样本评估中比现有方法性能高出56%。研究团队还开发了轻量级仿真环境EgoGym加速模型迭代，并在多个机器人平台上验证了跨平台兼容性。这项工作为资源受限环境下的机器人学习提供了高效解决方案。

至顶网科技行者 2026-02-12 13:27:39

国家数据局等部门关于印发《“数据要素×”三年行动计划（2024—2026年）》的通知

至顶网国家数据局 2024-01-19 11:41:00

约翰内斯开普勒大学突破：让计算机像人脑一样处理多维信息的神奇技术

这项由奥地利约翰内斯开普勒大学团队开发的pLSTM技术，创新性地解决了人工智能在处理多维数据时的核心难题。通过引入源门、转换门和标记门三种机制，实现了真正的多维并行信息处理。在箭头指向外推任务中展现出优异的泛化能力，在图像识别和分子图谱分析等实际应用中也显示出强大潜力，为构建更智能的多维信息处理系统开辟了新路径。

至顶网科技行者 2025-06-19 12:53:35

北京大学团队首次全面评估GPT-4o图像生成能力：AI绘画竞赛中的新冠军诞生

这项由北京大学等多所高校联合完成的研究，首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系，从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o，发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构，并发现其生成图像仍可被现有检测工具有效识别，为AI图像生成领域提供了重要的评估基准和技术洞察。

至顶网科技行者 2025-07-15 11:38:08

波兰研究团队揭秘：为什么聪明的AI大模型会被几个错别字轻松"骗倒"？

波兰研究团队发现，即使是最先进的AI大模型在处理波兰语等非主流语言时也极其脆弱，仅通过几个拼写错误或字符替换就能让AI做出错误判断。研究团队开发了一套巧妙的测试框架，使用小型代理模型找出关键词汇，然后对这些词汇进行十种不同的"伪装攻击"。实验结果显示，这些简单攻击能让先进AI模型的错误率飙升至48%以上，揭示了当前AI技术在多语言安全方面的严重漏洞。

至顶网科技行者 2025-06-13 08:02:53

CSDI：培养数字化复合型人才

9月16-18日，2022CSDI峰会帮助企业利用技术认知、AI、云计算、大数据等进行数字化重塑。

至顶网业界供稿 2022-08-08 12:06:42

香港科技大学重磅发布Audio-FLAN：全球首个音频版"GPT"，让AI既能听又能创造

香港科技大学研究团队发布了Audio-FLAN，这是全球首个大规模音频指令训练数据集。该数据集涵盖语音、音乐、声音三大领域的80个任务，包含超过1亿个训练样本，首次实现了音频领域的统一指令学习。通过类似ChatGPT的训练方法，Audio-FLAN能够训练出既能理解又能生成音频的通用AI模型，有望推动音频人工智能从专业化工具向通用助手的转变。

至顶网科技行者 2025-08-20 18:06:21

UC默塞德等高校联合推出Sa2VA：让AI同时看懂图像和视频的智能助手

Sa2VA是由UC默塞德等高校联合开发的突破性AI系统，首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力，Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集，显著提升了AI在长文本描述和复杂场景下的表现。实验显示，Sa2VA在多个基准测试中达到业界领先水平，为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。

至顶网科技行者 2025-09-16 11:09:55