搜一下
用了 0.037157秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容2143 条
全球首个开源音视频同步生成模型!StepFun团队让AI直接创造带声音的视频
由StepFun等机构开发的UniVerse-1是全球首个开源音视频同步生成模型,采用创新的"专家缝合"技术融合视频和音频生成专家,配合在线标注流水线解决数据对齐问题,在7600小时训练数据上实现了协调的音视频内容生成,为开源社区提供了完整的技术方案和评估基准。
至顶网
科技行者 2025-09-22 10:25:59
Kimi团队发布K1.5:让AI像人类一样"边思考边学习"的突破性进展
Kimi团队发布的K1.5模型通过强化学习实现突破,让AI学会长链条思考和多模态推理。在数学、编程等测试中表现卓越,AIME得分77.5,MATH-500达96.2分,与OpenAI o1相当。创新的"长转短"技术让AI既能深度推理又能简洁回答,为AI智能化发展提供新思路。
至顶网
科技行者 2025-09-19 10:04:51
当3D建模遇上一秒魔法:腾讯华为联手打造的FlashVDM技术如何让3D创作"飞起来"
这项由腾讯混元实验室联合多所知名大学完成的研究,成功将3D模型生成时间从30多秒压缩到不到1秒,实现32倍速度提升。该技术通过创新的渐进式流程蒸馏和闪电向量解码器,在保持生成质量的同时大幅提升了效率,为游戏开发、建筑设计、影视制作等领域带来革命性改变,使3D内容创作从专业技能变成人人可用的日常工具。
至顶网
科技行者 2025-07-31 09:57:03
打造更公平的AI训练:Mozilla和EleutherAI联手制定开放数据集最佳实践指南
Mozilla和EleutherAI联合发布了一份关于创建开放授权大语言模型训练数据集的最佳实践指南。该研究通过召集30位专家,制定了七个核心原则和详细的技术建议,旨在解决当前AI训练数据版权争议、透明度不足等问题,推动构建更加开放、公平和可持续的AI生态系统,为未来AI发展提供了重要的指导框架。
至顶网
科技行者 2025-09-17 13:32:48
机器人也能像人一样理解世界:中科院团队让AI机器人仅用3次演示就学会复杂操作
中科院团队开发的BridgeVLA系统实现了机器人学习的重大突破,仅需3次演示就能让机器人掌握复杂操作技能,成功率达96.8%。该系统通过巧妙的输入输出对齐设计和创新的预训练策略,让机器人能够真正理解三维空间和语言指令,为智能机器人的普及应用奠定了重要基础。
至顶网
科技行者 2025-06-20 10:25:47
香港科技大学新技术:AI也能像PS高手一样精准换形状
香港科技大学研究团队提出Follow-Your-Shape技术,通过创新的轨迹分歧图机制实现精准的AI图像形状编辑。该方法无需遮罩和训练,能准确识别编辑区域并保持背景完整,在新构建的ReShapeBench基准测试中全面超越现有方法,为创意设计、广告制作和内容创作等领域提供强大工具支持。
至顶网
科技行者 2025-08-14 10:28:24
机器人终于会"想"再"动"了——艾伦人工智能研究院的MolmoAct模型让机器人拥有空间推理能力
艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。
至顶网
科技行者 2025-08-14 10:29:17
任何条件都能变成视频:国立新加坡大学联合快手发布Any2Caption,让AI视频生成更懂你的心思
这项研究首次提出了"任意条件到文字描述"的视频生成新模式,通过多模态大语言模型将用户的各种创意输入转化为结构化描述,再驱动现有视频生成系统。研究团队构建了包含33.7万实例的大规模数据集,并设计了创新的渐进式训练策略,实现了对图像、人体姿态、摄像机轨迹等多种条件的统一理解,显著提升了视频生成的可控性和质量。
至顶网
科技行者 2025-07-16 09:59:35
GLiClass:轻量级文本分类的全能新秀,从乌克兰基辅走向世界的AI突破
GLiClass是由乌克兰基辅Knowledgator工程公司开发的创新文本分类模型,基于GLiNER架构改进而成。该模型通过联合编码文本和标签,在单次前向传递中完成多标签分类,实现了准确性与效率的完美平衡。测试显示,GLiClass不仅在准确性上超越强基准模型5.5%,处理速度更是比传统交叉编码器快2.3-16倍,特别是在大标签集场景下优势明显。模型已开源并提供多个规模版本以适应不同应用需求。
至顶网
科技行者 2025-08-14 12:44:58
让静态人像"开口说话":Hedra公司推出MagicInfinite,用声音和文字让照片动起来
Hedra公司推出的MagicInfinite技术能够让静态人像照片"开口说话",支持通过声音和文字双重控制生成高质量动态视频。该系统采用3D全注意力机制和两阶段训练方案,可处理各种风格人像(真实照片、动漫、艺术作品),实现精确的嘴唇同步。经过模型蒸馏优化后,生成速度提升20倍,10秒内可生成10秒视频。在用户测试中,91.33%的参与者认为其表现优于现有同类技术。
至顶网
科技行者 2025-07-30 09:58:49
YuE:能创作五分钟完整歌曲的AI音乐家诞生了,香港科技大学开发的开源音乐生成模型震撼发布
香港科技大学研究团队开发出首个开源长篇音乐生成模型YuE,能根据歌词创作5分钟完整歌曲。该系统采用双阶段架构和轨道解耦技术,在人工评估中与商业系统性能相当,支持多语言创作和风格转换,为音乐创作民主化奠定基础。
至顶网
科技行者 2025-08-01 10:17:46
微软团队让AI聊天更快更省钱:SIGMA模型把计算机系统管理变成会说话的智能助手
微软团队开发的SIGMA是首个专为系统域任务设计的高效大语言模型,通过创新的DiffQKV注意力机制在保持性能的同时大幅提升推理效率,在长文本场景下速度提升达33.36%。该模型在系统管理任务上的表现全面超越GPT-4,为AI在专业技术领域的应用开辟了新路径。
至顶网
科技行者 2025-09-17 10:02:32
JAM音乐生成器:新加坡科技设计大学让电脑学会作词谱曲,词曲同步精准到每个字
新加坡科技设计大学研究团队开发了JAM音乐生成系统,能够根据歌词生成完整歌曲,并实现词级精确时间控制。该系统仅用5.3亿参数就超越了参数量更大的同类系统,在歌词准确性、音乐质量等方面表现优异。通过创新的流匹配技术和审美对齐机制,JAM为AI音乐创作提供了新的技术路径。
至顶网
科技行者 2025-08-04 13:34:24
电脑终于学会了像人类一样用键盘鼠标:ByteDance推出会玩游戏的AI助手
ByteDance Seed团队开发的UI-TARS-2是一个革命性的AI助手,能够通过观看屏幕并用鼠标键盘操作电脑,就像人类一样完成各种任务和游戏。该系统采用创新的"数据飞轮"训练方法,在多项测试中表现出色,游戏水平达到人类的60%左右,在某些电脑操作测试中甚至超越了知名AI产品,展现了AI从对话工具向真正智能助手演进的巨大潜力。
至顶网
科技行者 2025-09-24 13:56:45
机器人有了"第六感":首尔大学让AI机器人学会在不确定时"看仔细点,做慢点"
首尔大学开发的SCALE技术让AI机器人具备了类似人类的"第六感",能够感知自身的不确定程度并据此调整观察和行动策略。这项技术无需额外训练即可集成到现有机器人系统中,在复杂环境下的任务成功率提升显著,代表了机器人从被动执行向智能适应的重要转变。
至顶网
科技行者 2026-02-11 15:57:47
Meta AI团队颠覆性突破:让机器像人类一样聪明地整合多个答案
Meta AI团队开发的AggLM技术突破了传统AI多数投票的局限,通过强化学习训练模型学会智能聚合多个候选答案。在数学竞赛测试中,该技术将正确率从35%提升至50%,相比传统方法提升45%。AggLM不仅能选择正确答案,还能创造性地组合不同答案中的有用信息,展现了AI向人类专家级推理能力的重要进步。
至顶网
科技行者 2025-09-28 13:47:12
万字指南 | 当SaaS出海“回到”美国,那些共识与非共识背后的观察与思考
以美国为主的北美市场通常是软件及科技创业者迈向全球的第一步,这里不仅诞生了许多具备产品创新和技术特色的 SaaS 及软件公司,而且在生成式 AI 从硅谷席卷全球的这两年,软件产业也最先被“渗透”,甚至最近有人大呼:“AI 已来,SaaS 将死?”
至顶网
Linkloud 2024-10-17 14:04:30
延世大学研究团队发布G-FOCUS:让AI像设计师一样评判网页界面说服力
延世大学研究团队首次让AI具备专业设计师级别的网页说服力评判能力,开发出G-FOCUS智能评估系统和WISERUI-BENCH标准数据库。该技术通过目标导向的四步推理过程,能够像人类专家一样分析网页设计的用户说服效果,准确性达70%且显著减少评判偏见,为快速低成本的设计优化提供了科学可靠的AI辅助方案。
至顶网
科技行者 2025-07-08 09:30:16
游戏世界也能"人工制造"?Skywork AI让你用键盘鼠标随心创造虚拟世界
Skywork AI推出Matrix-Game,这是首个能根据键盘鼠标操作实时生成交互式游戏世界的AI模型。该系统使用2700小时《我的世界》视频训练,拥有170亿参数,能精确响应用户指令生成符合物理规律的游戏场景。研究团队还开发了GameWorld Score评测标准,验证了Matrix-Game在控制精度和视觉质量方面显著超越现有模型,为AI辅助游戏开发和虚拟世界创建开辟了新方向。
至顶网
科技行者 2025-06-30 10:21:50
微软HoloLens 2现身:科技魔法走进真实世界
HoloLens正在为人类提供一种新的工作、学习、交流和做事的方式。
至顶网
CNET 记者 SCOTT STEIN 2019-02-26 10:28:24
<
上一页
101
102
103
104
105
106
107
108
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号