搜一下
用了 0.063270秒,为您找到
bob
手机
在线
網纸
YB233
相关内容5544 条
让AI看懂视频因果关系:女王大学突破视频推理技术壁垒
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。
至顶网
科技行者 2025-07-09 15:45:45
香港中文大学团队让AI成为卡通制作神器:一张图加几笔线稿就能生成完整动画片
香港中文大学等机构联合研发的ToonComposer系统实现了动画制作的重大突破,仅需一张彩色图片和几张线稿草图即可自动生成完整卡通动画。该系统通过稀疏草图注入机制和空间低秩适配器技术,将传统的中间帧绘制和上色工作整合为统一的"后关键帧制作"阶段,大幅提升制作效率。实验显示其在视觉质量和动作连贯性等指标上显著超越现有方法,为动画产业的智能化发展开辟新路径。
至顶网
科技行者 2025-08-19 10:46:28
清华大学突破性发现:让AI像人类一样理解和表达情感的新方法
清华大学研究团队首次提出情感认知融合网络(ECFN),让AI能像人类一样理解和表达情感。该系统通过多层次情感处理架构,在情感识别准确率上比现有最佳系统提升32%,情感表达自然度提升45%。研究突破了传统AI情感理解的局限,实现了跨模态情感融合、动态情感追踪和个性化情感建模,为医疗、教育、客服等领域带来革命性应用前景。
至顶网
科技行者 2025-06-18 13:07:01
斯坦福大学揭秘:AI如何通过"拟人化"变得更聪明更可信
斯坦福大学研究团队通过大规模实验发现,AI系统的拟人化程度显著影响用户的信任和依赖行为。适度拟人化能提升信任度40%,但过度拟人化可能导致用户失去独立判断能力。研究揭示了年龄、性别等因素对拟人化接受度的影响,为AI设计提供了科学依据,强调需要在不同应用场景中平衡拟人化程度与用户理性判断的关系。
至顶网
科技行者 2025-08-25 12:27:54
台湾大学联合MediaTek和Nvidia突破性成果:让AI自己教自己说话识别,语音识别准确率提升55%
台湾大学联合MediaTek和Nvidia的研究团队开发了一种突破性的语音识别自我改进框架,无需大量人工标注数据即可显著提升AI语音识别准确率。该方法通过让AI生成伪标签训练语音合成系统,再用合成语音反向训练识别模型,形成自我强化循环。在台湾国语测试中,新模型Twister比原版Whisper错误率降低20-55%,数据效率提升10倍以上,为低资源语言AI应用提供了新路径。
至顶网
科技行者 2025-06-19 10:47:53
Kwai快手推出Keye-VL模型:让AI真正看懂短视频的突破性技术
快手推出的Keye-VL是一个专门为短视频理解而设计的80亿参数AI模型,在视频内容理解、数学推理和多模态任务方面达到同类模型中的最高水平。该模型采用独创的五模式推理系统和四阶段训练策略,能自动判断任务难度并选择合适的思考方式,在快手自建的KC-MMBench短视频基准测试中大幅领先其他模型。
至顶网
科技行者 2025-07-04 17:19:51
IBM THINK演讲实录 | IBM Services 高级副总裁Mark Foster: 以弹性应变 构建更强大的智慧企业
IBM Services 高级副总裁 Mark Foster 于IBM Think Digital 大会上的主题演讲全文。
至顶网
至顶网云计算频道 2020-05-12 14:37:36
字节跳动重磅发布OmniHuman-1.5:会"思考"的虚拟人,告别千篇一律的呆板表演
字节跳动推出OmniHuman-1.5,首次将认知科学的双系统理论应用到虚拟人技术中。该技术通过多模态大语言模型模拟人类的推理思考,结合创新的MMDiT架构和伪最后帧技术,让虚拟人不再只是机械地同步口型,而是能够根据说话内容的语义做出相应的表情和动作,大幅提升了虚拟人表现的自然度和智能化水平,为教育、娱乐、客服等领域带来革命性应用前景。
至顶网
科技行者 2025-09-03 11:37:21
AI视频生成新突破:天工AI让你用几张照片就能拍出好莱坞大片
天工AI推出的SkyReels-A2视频生成系统实现了重大突破,能够将多张不相关照片智能组合成高质量视频。该技术采用双分支架构处理语义和空间信息,通过200万训练样本学习元素组合规律。在与商业模型的对比中表现出色,特别是在物体一致性和视觉质量方面领先。该系统已开源,为创意产业、教育培训、虚拟电商等领域带来革命性应用前景。
至顶网
科技行者 2025-07-14 09:49:31
腾讯深圳大学革命性突破:让电脑理解语言的秘密武器终于诞生
腾讯和深圳大学联合开发的多视角语言理解技术取得重大突破,通过创新的训练方法让人工智能具备接近人类水平的语言理解能力。系统能准确识别讽刺、情感变化等复杂语言现象,在多项测试中表现优异,已在客服、教育、医疗等领域开始应用,未来有望广泛改善人机交互体验。
至顶网
科技行者 2025-08-27 10:31:04
华为团队重大突破:让AI直接理解数学题并给出严格证明,就像有了一个永不出错的数学助手
华为诺亚方舟实验室联合香港中文大学团队在2025年6月首次实现了从自然语言数学问题到严格证明的端到端自动化处理。他们开发的Mathesis系统包含创新的强化学习自动形式化器、精细化评估框架LeanScorer,以及高性能证明器,在中国高考数学测试集上达到18%成功率,相比最佳基线提升22%。该系统已集成到华为Celia智能助手中,将数学问题解决准确率从65.3%提升至84.2%,展现了AI数学推理的巨大应用潜力。
至顶网
科技行者 2025-06-16 09:57:21
多智能体AI系统为什么总是"团队翻车"?加州大学伯克利分校揭秘AI团队合作的14种失败模式
加州大学伯克利分校研究团队首次系统分析多智能体AI系统失败原因,发现即使先进的AI团队成功率也仅30%左右。通过分析200多个案例,他们识别出14种失败模式,归类为规格说明、智能体协调和任务验证三大问题,并开发了MAST诊断工具。研究揭示失败根源在于系统设计缺陷而非AI能力不足,为改进AI团队协作提供了重要指导。
至顶网
科技行者 2025-07-31 11:26:24
新加坡国立大学重磅报告:AI学术会议正走向崩溃边缘!
新加坡国立大学研究团队通过数据分析揭示,当前AI学术会议面临四大危机:研究人员年均发表超过4.5篇论文、会议碳排放超过主办城市日排放量、71%相关讨论呈负面情绪、会场容量不足需抽签限制参与。研究提出社区联邦会议模式,将传统集中式会议分解为全球评议系统、地区小型中心和数字协作平台三层架构,以实现可持续的学术交流。
至顶网
科技行者 2025-08-11 11:03:15
M-A-P团队发布COIG-P:首个百万级中文人工智能偏好训练数据集,重新定义AI中文对话能力
M-A-P团队发布的COIG-P数据集包含100万个高质量中文偏好样本对,通过15个AI模型协作生成和8个AI评委评分构建。该数据集覆盖对话、编程、数学等六大领域,显著提升了中文AI模型性能,相关模型在AlignBench评测中获得2%-12%的性能提升。团队还开源了中文奖励模型CRM和评估基准CRBench,为中文AI社区提供了重要的开源基础设施。
至顶网
科技行者 2025-07-15 09:59:24
当大语言模型遇上环保意识:西班牙研究团队首次揭示能耗信息如何改变AI选择
西班牙马德里理工大学研究团队开发了全球首个融入能耗意识的AI评估平台——生成式能源竞技场(GEA),通过对694个评估样本的分析发现,当用户了解AI模型能耗信息后,46%的用户会改变原始选择,更节能小模型的获胜率从50%跃升至75%以上,揭示了能耗意识对AI选择的显著影响,为构建可持续AI生态系统提供重要科学依据。
至顶网
科技行者 2025-07-24 16:21:25
微软让AI学会"画像"用户:推荐系统变身贴心管家的秘密武器
微软研究团队开发了LettinGo框架,通过让AI用自然语言生成用户画像来改进推荐系统。该方法分三步:多模型探索生成多样化用户档案,通过实际推荐效果评估档案质量,最后用偏好对齐技术训练专门的档案生成器。在三个主要数据集上的实验显示,相比传统方法平均准确率提升20个百分点,且生成的档案更灵活、可解释性更强。
至顶网
科技行者 2025-06-26 10:12:25
淘宝推荐系统的革命性升级:RecGPT如何让购物变得更智能
阿里巴巴淘宝团队开发的RecGPT推荐系统,通过大语言模型深度理解用户购物行为背后的真实意图,实现了从"学点击推点击"到"理解需求推商品"的根本转变。系统在淘宝全面部署后,用户体验多样性提升6.96%,点击率增长6.33%,同时有效缓解了推荐系统的马太效应,为数亿用户提供更智能的购物体验。
至顶网
科技行者 2025-08-06 12:50:35
乔治亚理工学院开发AI聊天界面,让机器人明白你真正想要什么
乔治亚理工学院联合Adobe Research开发的OnGoal系统,通过智能目标追踪和可视化反馈,解决了用户与AI长对话时目标混乱、沟通低效的问题。20人实验证明,该系统让用户完成任务更快、压力更小,还能学会更有效的AI沟通策略,为未来人机协作指明了透明化、个性化的发展方向。
至顶网
科技行者 2025-09-04 14:31:26
Moonshot AI发布Kimi-VL:仅用3B参数就能媲美大型AI的超级视觉模型
Moonshot AI发布了新一代视觉语言模型Kimi-VL,该模型采用混合专家架构,仅用2.8B激活参数就能媲美大型模型性能。其创新包括原生分辨率视觉编码器、128K长上下文处理能力和长链思考推理机制。在多项基准测试中,Kimi-VL在数学推理、文档理解、智能体任务等方面表现出色,证明了小参数高效能的设计理念,为AI技术的普及和可持续发展提供了新思路。
至顶网
科技行者 2025-07-17 09:28:25
华为开发者大会2022:让鸿蒙生态不断扩展数字世界边界
华为开发者大会2022(Together)今天在东莞松山湖揭开帷幕,带来了鸿蒙生态的最新成果,展示了鸿蒙生态的全新格局。
至顶网
任新勃 2022-11-04 22:43:56
<
上一页
271
272
273
274
275
276
277
278
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号