搜一下
用了 0.205548秒,为您找到
宝宝
计划
手机
软件
網纸
YB233
相关内容17632 条
拍照文档歪歪扭扭?这套清华等顶尖院校联合开发的AI系统让文档瞬间变平整!
这项由清华旗下奇虎科技等机构联合开发的研究,提出了ForCenNet前景中心网络来解决
手机
拍摄文档变形问题。与传统均匀处理方法不同,该系统重点关注文档中的关键信息区域如文字和表格线条,采用创新的前景分割、掩码引导和曲率一致性优化技术,在四个主流数据集上达到最优性能,为移动文档数字化提供了高效解决方案。
至顶网
科技行者 2025-08-04 13:34:52
对话达观数据陈运文:我们在打破文本智能处理的“真空地带”
陈运文34岁那年,是2015年,他离开任职多年的大厂,转而投身于“大众创业、万众创新”的时代浪潮中。从此,他成为达观数据董事长兼CEO,他的使命是“扛起国内文本智能处理ToB业务这面大旗”。
至顶网
周雅 2022-09-20 10:25:54
斯坦福大学推出SMMILE:首个医学AI在情境学习能力评估基准,揭示现有AI在医疗诊断中的致命弱点
这项研究汇集了来自斯坦福大学、苏黎世联邦理工学院、隆德大学、加州大学旧金山分校等多所世界顶尖学府的11位医学专家,共同构建了医学AI领域的首个多模态情境学习评估标准。
至顶网
科技行者 2025-07-02 10:59:36
清华大学团队让AI动画角色随心所欲变身:从人类到恐龙,只需几个动作示例
清华大学和香港大学团队开发的Motion2Motion技术突破了动画制作中的动作转移难题,通过稀疏对应和动作片段匹配机制,实现了不同身体结构角色间的智能动作转移。该系统无需GPU设备即可实时运行,仅需少量示例和关键对应关系就能生成自然协调的动作,为游戏开发、影视制作等领域提供了革命性的创作工具。
至顶网
科技行者 2025-08-27 15:13:11
千人聚会、50万人围观,2024 AI创新者大会暨PEC·提示工程峰会顺利召开
一句提示词,一个新世界。
至顶网
金旺 2024-11-16 20:38:45
上海人工智能实验室发布OmniWorld:首个专为4D世界建模打造的大规模多领域数据集
上海人工智能实验室发布OmniWorld,这是首个专为4D世界建模设计的大规模多领域数据集。该数据集包含超过3亿帧数据,涵盖游戏、机器人、人类活动等多个领域,配备深度、相机位置、文本等多种标注。研究证明现有AI模型在复杂时空理解方面存在局限,而使用OmniWorld微调后性能显著提升,为自动驾驶、机器人、虚拟现实等应用发展奠定基础。
至顶网
科技行者 2025-09-28 11:00:31
AI也会"看脸色"了?南京大学团队让大语言模型学会了见机行事
这项由南京大学团队开发的FASB技术让AI学会了"察言观色"和"知错能改"。通过实时监控AI内部状态并动态调整干预强度,该方法在多个测试中将AI回答准确率提升了近50%。研究团队创新性地引入了回退机制,让AI能在发现问题时"重新来过",显著提升了回答质量。该技术在教育、客服、内容创作等领域具有广阔应用前景。
至顶网
科技行者 2025-09-03 12:28:34
得与失——一位程序员的创业之路
每一个程序员的心中或许都有这样一个梦:有一天,做出一个心中的完美产品,让全世界的人使用它。 蒋南国和他的合伙人创业七载,经历了无数的风风雨雨。作为一个技术合伙人,当拥有了对产品的决策权,他是否实现了自己的梦想,又会遭遇哪些坎坷?
至顶网
尼酱 2022-06-28 10:58:46
南洋理工大学团队开发FastMesh:3D建模革命让艺术家梦想照进现实
FastMesh是新加坡南洋理工大学开发的革命性3D网格生成技术,通过分离处理顶点和面片,将传统方法的标记数量减少到23%,实现8倍速度提升。该技术采用自回归模型生成顶点,用双向变换器构建面片,并配备保真度增强器优化细节质量。在标准测试中表现优异,生成1000顶点模型仅需7秒,为游戏、影视、VR等行业提供了高效的3D内容创作解决方案。
至顶网
科技行者 2025-10-10 13:58:07
瑞士AI联盟发布全球首个真正开源的大型语言模型:Apertus如何用15万亿字符数据改写AI训练规则
瑞士AI联盟发布全球首个真正开源的大型语言模型Apertus,在15万亿字符、1811种语言数据上训练。该模型采用创新的"金鱼损失"技术防止逐字记忆,严格遵循数据合规标准,提供80亿和700亿参数版本。研究团队完全公开训练代码、数据处理脚本等所有技术细节,树立了透明、可信赖的AI开发新标准。
至顶网
科技行者 2025-10-13 08:56:53
ArtifactsBench:腾讯混元团队重新定义AI代码生成评测标准,让机器写出真正能看能用的界面程序
腾讯混元团队推出ArtifactsBench,这是全球首个专门评测AI生成视觉交互代码质量的综合基准系统。该系统包含1825个真实应用场景测试任务,创新性地通过实际运行代码、动态截图、多模态AI评委等方式,从功能性、美观度、用户体验等十个维度进行评测。实验结果显示其与人类专家判断一致性超过90%,与业界金标准WebDev Arena的一致性达94.4%,为AI代码生成能力评估树立了新标准。
至顶网
科技行者 2025-07-11 10:13:36
斯坦福和伯克利联手出招:AI能看出你动作哪里不标准了!
斯坦福和伯克利研究团队推出VidDiff技术,让AI学会像专业教练一样精准识别动作差异。该技术通过三步走方法解决视频动作比较难题,构建了包含549对视频的大型数据集VidDiffBench。虽然当前AI模型准确率有限,但已展现在健身指导、医学培训、体育分析等领域的应用潜力。研究为AI理解细微动作差异开辟新方向,有望让人人享有智能化的动作指导。
至顶网
科技行者 2025-07-30 09:51:47
纽约大学团队重新定义机器人学习:用"接触点"替代语言指令,让机器人更懂物理世界
纽约大学等多家机构联合研究提出了接触锚定策略,用物理接触点替代语言指令来训练机器人。该方法仅用23小时演示数据就实现了抓取、开启和关闭三种基本操作,在零样本评估中比现有方法性能高出56%。研究团队还开发了轻量级仿真环境EgoGym加速模型迭代,并在多个机器人平台上验证了跨平台兼容性。这项工作为资源受限环境下的机器人学习提供了高效解决方案。
至顶网
科技行者 2026-02-12 13:27:39
国家数据局等部门关于印发《“数据要素×”三年行动
计划
(2024—2026年)》的通知
国家数据局等部门关于印发《“数据要素×”三年行动
计划
(2024—2026年)》的通知
至顶网
国家数据局 2024-01-19 11:41:00
约翰内斯开普勒大学突破:让计算机像人脑一样处理多维信息的神奇技术
这项由奥地利约翰内斯开普勒大学团队开发的pLSTM技术,创新性地解决了人工智能在处理多维数据时的核心难题。通过引入源门、转换门和标记门三种机制,实现了真正的多维并行信息处理。在箭头指向外推任务中展现出优异的泛化能力,在图像识别和分子图谱分析等实际应用中也显示出强大潜力,为构建更智能的多维信息处理系统开辟了新路径。
至顶网
科技行者 2025-06-19 12:53:35
北京大学团队首次全面评估GPT-4o图像生成能力:AI绘画竞赛中的新冠军诞生
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。
至顶网
科技行者 2025-07-15 11:38:08
波兰研究团队揭秘:为什么聪明的AI大模型会被几个错别字轻松"骗倒"?
波兰研究团队发现,即使是最先进的AI大模型在处理波兰语等非主流语言时也极其脆弱,仅通过几个拼写错误或字符替换就能让AI做出错误判断。研究团队开发了一套巧妙的测试框架,使用小型代理模型找出关键词汇,然后对这些词汇进行十种不同的"伪装攻击"。实验结果显示,这些简单攻击能让先进AI模型的错误率飙升至48%以上,揭示了当前AI技术在多语言安全方面的严重漏洞。
至顶网
科技行者 2025-06-13 08:02:53
CSDI:培养数字化复合型人才
9月16-18日,2022CSDI峰会帮助企业利用技术认知、AI、云计算、大数据等进行数字化重塑。
至顶网
业界供稿 2022-08-08 12:06:42
香港科技大学重磅发布Audio-FLAN:全球首个音频版"GPT",让AI既能听又能创造
香港科技大学研究团队发布了Audio-FLAN,这是全球首个大规模音频指令训练数据集。该数据集涵盖语音、音乐、声音三大领域的80个任务,包含超过1亿个训练样本,首次实现了音频领域的统一指令学习。通过类似ChatGPT的训练方法,Audio-FLAN能够训练出既能理解又能生成音频的通用AI模型,有望推动音频人工智能从专业化工具向通用助手的转变。
至顶网
科技行者 2025-08-20 18:06:21
UC默塞德等高校联合推出Sa2VA:让AI同时看懂图像和视频的智能助手
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。
至顶网
科技行者 2025-09-16 11:09:55
<
上一页
871
872
873
874
875
876
877
878
879
880
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号