搜一下
用了 0.064956秒,为您找到
北京
pk
精准
人工
计划
软件
網纸
YB233
相关内容5227 条
任何条件都能变成视频:国立新加坡大学联合快手发布Any2Caption,让AI视频生成更懂你的心思
这项研究首次提出了"任意条件到文字描述"的视频生成新模式,通过多模态大语言模型将用户的各种创意输入转化为结构化描述,再驱动现有视频生成系统。研究团队构建了包含33.7万实例的大规模数据集,并设计了创新的渐进式训练策略,实现了对图像、人体姿态、摄像机轨迹等多种条件的统一理解,显著提升了视频生成的可控性和质量。
至顶网
科技行者 2025-07-16 09:59:35
南开大学联合团队:让AI如厨师般巧妙搭配文字和图片,构建首个大规模多模态对话数据集
南开大学研究团队创建了InterSyn——首个大规模多模态对话数据集,包含180万单轮和5万多轮样本,覆盖3500个话题。通过创新的SEIR迭代优化方法,显著提升了AI生成文图结合内容的质量。同时开发的SynJudge评价工具能从四个维度评估文图协调性,与人类判断偏差仅5%。实验证明该方法在文图协调性上提升52.1%,为构建更智能的多模态AI系统奠定了基础。
至顶网
科技行者 2025-06-19 10:46:38
新加坡国立大学研究:什么样的提示词能让AI更聪明?揭秘人机对话的21个黄金法则
新加坡国立大学研究团队通过分析150多篇相关论文,首次建立了评估提示词质量的21属性框架。研究发现当前提示词研究存在严重不平衡,某些模型和任务被过度关注。通过969个高质量提示词样本分析,团队发现属性间存在强关联性。实验显示单一属性优化往往比多属性组合效果更佳,且用属性增强数据训练的模型表现显著提升。
至顶网
科技行者 2025-06-17 15:23:05
AIRI研究院:让AI看图更高效,一半图像特征就够用了
这项由莫斯科
人工
智能研究院完成的研究证明了AI可以通过智能特征选择在保持性能的同时大幅提高效率。研究团队开发了基于自编码器和Gumbel-Softmax的特征筛选方法,在文字识别任务中即使删除50%视觉特征也能维持近似性能,为多模态AI系统的效率优化提供了新思路。
至顶网
科技行者 2025-08-01 14:43:33
FusionAudio-1.2M:当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究
香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的大规模数据集。实验表明,使用该数据集训练的AI模型在音频理解和检索任务上显著超越现有方法,为智能语音助手、自动驾驶等领域带来重要应用前景。
至顶网
科技行者 2025-06-11 07:48:46
塔尔图大学最新突破:让普通显微镜像"火眼金睛"一样
精准
识别细胞
塔尔图大学研究团队开发了IAUNet细胞分割系统,这是首个将U-Net与Transformer查询机制结合的生物医学AI技术。该系统能够精确识别明场显微镜下重叠的细胞,性能超越现有方法同时参数更少。研究团队还构建了Revvity-25数据集,包含110张高精度标注图像,每个细胞使用60-400个多边形点精确描绘。IAUNet在多个数据集上均取得最佳性能,为药物研发、疾病诊断等提供重要工具。
至顶网
科技行者 2025-08-11 14:29:34
北京
大学研究团队打造"3D零件拼装师":一张照片就能拆解出完整立体模型的神奇技术
北京
大学等机构的研究团队开发出PartCrafter技术,能够从单张照片同时生成多个3D零件组成完整模型,无需预先图像分割。该技术采用创新的局部-全局注意力机制,在保证零件细节的同时确保整体协调性。相比传统先整体后分解的方法,PartCrafter生成速度快18倍,质量更优,甚至能重建照片中不可见的部分,为游戏开发、电影制作、工业设计等领域提供了革命性工具。
至顶网
科技行者 2025-06-10 14:19:36
吴恩达LangChain对话:别纠结Agent定义,成功的智能体往往从线性工作流开始,Vibe Coding这个概念充满误导
毫无疑问,Agent,也就是智能体已经预定了今年的最火AI关键词。不知道明年会不会是AGI呢,既然OpenAI和Anthropic的预测都是在2027年左右。而在Agent领域,非常有发言权的一位就是吴恩达。LangChain前不久的开发者活动Interrupt上,LangChain创始人Harrison Chase邀请了吴恩达专门做了一场对话
至顶网
高飞的电子替身 2025-06-03 15:03:18
人工
智能创新样本:云从科技“梭哈”人机协同
1997年,国际象棋冠军卡斯帕罗夫,输给了“深蓝”,一台电脑。于是有人恐惧于“机器至上”的终局。
至顶网
业界供稿 2021-09-22 19:05:26
万字指南 | 当SaaS出海“回到”美国,那些共识与非共识背后的观察与思考
以美国为主的北美市场通常是
软件
及科技创业者迈向全球的第一步,这里不仅诞生了许多具备产品创新和技术特色的 SaaS 及
软件
公司,而且在生成式 AI 从硅谷席卷全球的这两年,
软件
产业也最先被“渗透”,甚至最近有人大呼:“AI 已来,SaaS 将死?”
至顶网
Linkloud 2024-10-17 14:04:30
延世大学研究团队发布G-FOCUS:让AI像设计师一样评判网页界面说服力
延世大学研究团队首次让AI具备专业设计师级别的网页说服力评判能力,开发出G-FOCUS智能评估系统和WISERUI-BENCH标准数据库。该技术通过目标导向的四步推理过程,能够像人类专家一样分析网页设计的用户说服效果,准确性达70%且显著减少评判偏见,为快速低成本的设计优化提供了科学可靠的AI辅助方案。
至顶网
科技行者 2025-07-08 09:30:16
NVIDIA发布Cosmos-Reason1:让AI拥有物理常识和身体推理能力的突破性研究
NVIDIA团队开发的Cosmos-Reason1是首个专门针对物理推理的多模态AI系统,通过创新的训练方法让AI具备了理解物理世界和进行具身推理的能力。该系统包含70亿和560亿参数两个版本,采用物理AI监督微调和强化学习两阶段训练,在物理常识和具身推理评测中显著超越现有模型,为机器人、自动驾驶等应用奠定重要技术基础。
至顶网
科技行者 2025-07-31 11:28:01
绘就共商共享新画卷,谱写善治善智新篇章——写在2024世界
人工
智能大会开幕之前
2024年7月4日,2024世界
人工
智能大会暨
人工
智能全球治理高级别会议即将在浦江之畔揭开帷幕。在“一带一路”倡议提出十周年的时间节点,在AI Agent再次引爆
人工
智能新热潮的现在,在各类
人工
智能技术及应用不断融入人们日常生活的当下,此次大会讲“以共商促共享,以善治促善智”作为主题,聚集世界各国代表、顶级专家学者、行业精英、初创团队等,共同探讨在
人工
智能深度发展时代下的热点话题。
至顶网
至顶网人工智能频道 2024-07-03 12:51:10
绘就共商共享新画卷,谱写善治善智新篇章——写在2024世界
人工
智能大会开幕之前
本届大会由外交部、国家发展改革委、教育部、科技部、工业和信息化部、国家网信办、中国科学院、中国科协和上海市政府共同主办,打造“会议论坛、展览展示、评奖赛事、智能体验”四大板块,聚焦
人工
智能领域前沿技术、产业动向、向善治理等全球
人工
智能行业普遍关心的领域。
至顶网
科技行者 2024-07-03 12:52:42
新加坡国立大学团队揭示:让AI既能看又能做的视觉强化学习新突破
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。
至顶网
科技行者 2025-08-13 14:37:30
ByteDance发布Seaweed-7B:用更少资源训练出媲美大模型的视频生成AI
ByteDance Seed团队发布的Seaweed-7B研究展示了如何用相对较少的计算资源(665,000 H100 GPU小时)训练出高质量视频生成模型。这个70亿参数的模型通过精细的数据处理、创新的VAE压缩技术、混合流架构和多阶段训练策略,在图像转视频任务中排名第二,在多项评估中超越了参数量更大的竞争对手,同时推理速度快62倍,证明了中等规模模型的巨大潜力。
至顶网
科技行者 2025-07-17 09:27:17
明尼苏达大学突破性研究:AI评判系统学会自我反思,让机器像人类一样思考评价
明尼苏达大学团队开发的MPO系统让AI评判具备了类似人类的元认知能力,能够自我反思并动态调整评价标准。该系统有效解决了AI训练中的"奖励欺骗"问题,在文章写作、文档总结、道德推理和数学推理四个任务中都表现出显著优势,为构建更智能、更可靠的AI系统开辟了新路径。
至顶网
科技行者 2025-07-14 09:49:47
Skywork AI团队揭秘:如何让AI助手真正理解人类喜好?史上最大规模偏好数据集诞生记
Skywork AI团队通过创新的人机协作数据处理方法,构建了史上最大规模的高质量偏好数据集SynPref-40M,训练出Skywork-Reward-V2系列模型。该系列在七项主要测试中全面超越现有最佳模型,证明了数据质量胜过算法复杂度的重要原理,为AI更好理解人类偏好开辟了新道路。
至顶网
科技行者 2025-07-04 17:22:18
KAIST团队突破性创新:让AI视频生成像调色师一样精确控制每一帧画面
韩国KAIST团队开发出革命性的"Frame Guidance"技术,这是首个无需训练即可精确控制AI视频生成的通用方法。该技术通过创新的潜在切片和视频潜在优化策略,将内存使用量减少60倍,让普通用户也能精确控制视频中任意帧的内容。实验表明,该方法在关键帧引导、风格化生成等任务上全面超越现有技术,为AI视频创作开启了全新可能。
至顶网
科技行者 2025-06-16 09:36:15
2022华为全球分析师大会:聚集当下和未来进行创新
华为第19届全球分析师大会在深圳开幕。
至顶网
至顶网物联网频道 2022-04-26 17:22:03
<
上一页
256
257
258
259
260
261
262
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号