搜索 mg娱乐公司是什么公司【網纸——YB233典CN—

AI视频生成新突破：天工AI让你用几张照片就能拍出好莱坞大片

天工AI推出的SkyReels-A2视频生成系统实现了重大突破，能够将多张不相关照片智能组合成高质量视频。该技术采用双分支架构处理语义和空间信息，通过200万训练样本学习元素组合规律。在与商业模型的对比中表现出色，特别是在物体一致性和视觉质量方面领先。该系统已开源，为创意产业、教育培训、虚拟电商等领域带来革命性应用前景。

至顶网科技行者 2025-07-14 09:49:31

当AI学会"察言观色"：卡内基梅隆等高校如何让盲人用户重新掌控自动化选择权

卡内基梅隆大学等机构研究团队开发了名为Morae的智能界面助手，专门解决盲人用户在使用AI自动化工具时失去选择权的问题。通过"动态模糊选择验证"机制，Morae能在关键决策点主动暂停询问用户偏好，而非自动替用户选择。用户研究显示，相比传统AI助手，Morae帮助用户做出了更多符合个人偏好的选择，显著提升了用户满意度和控制感。

至顶网科技行者 2025-09-05 10:13:39

创业者涌入AI战场，最先利用AI大模型赚到钱的人

AIGC淘金人。

至顶网吴彤 2024-07-18 14:40:10

全景虚拟世界的"修补术"：NVIDIA与台湾交大联手解决360度场景中物体消失的技术难题

台湾阳明交通大学与NVIDIA联合开发的AuraFusion360技术，首次实现了360度全景场景中物体完美移除和空缺自然填补。该技术通过深度感知识别、自适应深度扩散和智能纹理融合三大创新，解决了传统方法在多视角一致性方面的难题，为VR/AR、房地产、旅游等行业的360度内容制作提供了革命性工具。

至顶网科技行者 2025-08-20 18:06:48

ByteDance推出Seaweed-APT：1秒生成2秒高清视频，AI视频制作迈入实时时代

ByteDance研究团队开发出革命性的Seaweed-APT技术，实现了首个真正意义上的实时高清视频生成。该技术通过创新的对抗后训练方法，将传统需要25步和数分钟的视频生成过程压缩为单步1秒完成，能生成2秒长1280×720高清视频，视觉真实感提升37.2%。尽管在结构完整性方面存在一定权衡，但这项突破为AI内容创作、社交媒体、教育和娱乐等领域开启了实时视频生成的新时代。

至顶网科技行者 2025-09-15 14:43:48

腾讯混元团队发布MixGRPO：让AI图像生成训练效率提升71%的混合式加速方案

腾讯混元团队联合北京大学提出MixGRPO技术，通过混合ODE-SDE采样策略和滑动窗口机制，将AI图像生成训练效率提升50%-71%，同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略，专注于图像生成早期阶段的重点优化，并引入高阶求解器进一步加速训练过程，为AI图像生成的产业化应用提供了更高效可行的解决方案。

至顶网科技行者 2025-10-11 14:32:54

MIT实验室打造音频界"翻译官"：一个模型搞定语音、音乐和环境声

这篇论文介绍了MIT开发的USAD技术，这是一种能够同时理解语音、音乐和环境声音的通用音频AI模型。通过创新的知识蒸馏方法，USAD在多个音频处理任务上都达到了接近专门模型的性能水平，为构建更智能的音频理解系统奠定了基础。该技术在智能助手、多媒体处理、教育等领域具有广阔的应用前景。

至顶网科技行者 2025-06-27 16:59:36

微软让AI模型解码效率狂飙9倍：华丽变身"注意力侦探"的逻辑推理大脑

微软研究院联合多所知名高校开发出SeerAttention-R稀疏注意力框架，专门优化AI推理模型的长序列解码效率。该技术通过自蒸馏学习让AI学会智能筛选重要信息，在保持近乎无损推理准确性的同时，实现了高达9倍的计算加速。系统采用轻量级插件设计，无需重训原模型即可集成，为长文本AI推理应用的普及铺平道路。

至顶网科技行者 2025-06-16 16:18:00

香港大学与字节跳动联手打造的Goku：让AI同时掌握图片和视频生成的"变形金刚"

香港大学与字节跳动联合开发了名为Goku的AI模型，能够同时生成高质量图片和视频。该模型采用修正流技术和统一训练架构，使用1.6亿张图片和3600万段视频训练，在多项评测中达到业界领先水平，在VBench视频测试中获得84.85分，GenEval图片测试中达到0.76分，展现了AI视觉生成技术向通用化发展的新趋势。

至顶网科技行者 2025-08-25 14:27:23

Sber AI团队突破视频生成瓶颈：让超高清视频制作快2.7倍的神奇算法

俄罗斯Sber AI团队开发出NABLA算法，通过邻域自适应块级注意力机制实现AI视频生成2.7倍加速。该算法采用三步优化：降维侦察、智能筛选和精确映射，动态识别重要注意力区域，在保持视频质量的同时大幅减少计算开销，为高效AI视频生成提供新解决方案。

至顶网科技行者 2025-07-29 17:15:17

AGI万字长文(上) | 2023回顾与反思

2023年大众对AI的看法从怀疑到认可，AGI（通用人工智能）的发展迅速，大模型展现出惊人的想象力和取悦能力。应用层尚未出现独角兽，创业者面临官方技术迭代的挑战。

至顶网 AIGC开放社区 2024-03-14 15:04:20

香港大学团队发布600万张图像的AI绘画推理数据集：让AI像人类一样"想象"后再创作

香港大学团队发布史上最大规模AI绘画推理数据集FLUX-Reason-6M，包含600万张高质量图像和2000万条双语描述，耗费15000个GPU天计算资源。首创"生成链式思维"训练法，让AI学会像人类艺术家般思考创作过程。同时推出PRISM-Bench测评标准，对19个先进模型评测显示闭源模型仍领先，但所有模型在文字渲染等复杂任务上都有改进空间。

至顶网科技行者 2025-09-12 16:49:17

对话高通孟樸：自研Oryon CPU背后，是移动计算边界的再定义

骁龙峰会2024期间，高通中国区董事长孟樸接受了科技行者等媒体的采访，话题围绕自研芯片架构的故事、端侧AI的逻辑、汽车业务的布局、高通在中国市场的发展格局等内容展开。

至顶网周雅 2024-10-26 10:26:16

阿里达摩院VACE：一个模型搞定所有视频创作，从文字到视频再到精细编辑全包了

阿里达摩院推出VACE系统，这是首个能够统一处理文字转视频、视频编辑、遮罩编辑等12种视频任务的AI模型。通过创新的视频条件单元(VCU)和上下文适配器架构，VACE不仅能单独完成各类视频生成编辑任务，还支持任务组合创造出传统方法无法实现的效果，为视频创作提供了革命性的一站式解决方案。

至顶网科技行者 2025-08-01 10:14:02

中科大团队让AI用两张照片就能"看懂"整个3D世界：稀疏视角重建技术的革命性突破

中科大团队开发了MeshSplat技术，仅用两张照片就能重建完整3D场景。该技术首次将2D高斯散点应用于稀疏视角表面重建，通过加权距离约束和法向预测网络显著提升重建质量。实验显示其性能比现有方法提升30%，在房地产、电商、文物保护等领域具有广泛应用前景。

至顶网科技行者 2025-09-02 09:31:47

黄仁勋与扎克伯格做了一场关于Meta生成式AI未来的探讨（附对话实录）

英伟达CEO黄仁勋和Meta CEO马克·扎克伯格，在美国丹佛举行的第50届SIGGRAPH图形大会上进行了一场关于生成式AI的对话，并且他们还互赠了皮衣。

至顶网王聪彬 2024-07-30 16:38:56

GLiClass：轻量级文本分类的全能新秀，从乌克兰基辅走向世界的AI突破

GLiClass是由乌克兰基辅Knowledgator工程公司开发的创新文本分类模型，基于GLiNER架构改进而成。该模型通过联合编码文本和标签，在单次前向传递中完成多标签分类，实现了准确性与效率的完美平衡。测试显示，GLiClass不仅在准确性上超越强基准模型5.5%，处理速度更是比传统交叉编码器快2.3-16倍，特别是在大标签集场景下优势明显。模型已开源并提供多个规模版本以适应不同应用需求。

至顶网科技行者 2025-08-14 12:44:58

南开大学联合团队：让AI如厨师般巧妙搭配文字和图片，构建首个大规模多模态对话数据集

南开大学研究团队创建了InterSyn——首个大规模多模态对话数据集，包含180万单轮和5万多轮样本，覆盖3500个话题。通过创新的SEIR迭代优化方法，显著提升了AI生成文图结合内容的质量。同时开发的SynJudge评价工具能从四个维度评估文图协调性，与人类判断偏差仅5%。实验证明该方法在文图协调性上提升52.1%，为构建更智能的多模态AI系统奠定了基础。

至顶网科技行者 2025-06-19 10:46:38

Adobe Research与德州大学联手破解AI视频生成新难题：让人工智能边做边学，告别错误累积

Adobe Research与德州大学联手开发"自我强迫"训练法，让AI在视频生成时边做边学，彻底解决传统方法中错误会越积越多的问题。这种创新训练方式实现了真正的实时视频生成，在单GPU上达到17帧每秒的处理速度和亚秒级延迟，为直播、游戏和实时交互应用开辟了全新可能性。研究团队还引入滚动键值缓存机制，实现了理论上无限长的视频生成能力。

至顶网科技行者 2025-06-16 09:34:19

上海AI实验室的新突破：让你用键盘控制的虚拟世界探险家YUME

上海AI实验库推出YUME系统，用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术，将复杂的三维控制简化为WASD键操作，并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力，不仅能处理真实场景，还能重现动漫、游戏等各种艺术风格的虚拟世界，为虚拟现实和交互娱乐领域提供了全新的技术路径。

至顶网科技行者 2025-07-28 15:33:14