搜索 ku游娱乐代理【網纸——YB233典CN—

中国香港大学团队开发"学习小助手"：让自主学习变得像玩游戏一样简单

中国香港中文大学（深圳）研究团队开发了SRLAgent智能学习系统，通过Minecraft游戏环境结合AI助手帮助大学生培养自主学习能力。实验显示该系统能显著提升学生的学习规划和过程监控能力，但也发现过度AI支持可能产生依赖性，提出需要平衡支持与独立能力培养的重要性。

至顶网科技行者 2025-06-20 11:05:00

圣母大学团队发布史上最全面大语言模型跨学科应用报告：从历史哲学到生物工程，AI如何重塑13个学术领域

圣母大学研究团队发布了迄今最全面的大语言模型跨学科应用调研报告，系统梳理了AI在人文、商业、科学工程等13个领域的应用现状。研究发现，大语言模型在文本处理和模式识别方面表现优异，但在创造性思维和价值判断上仍有局限。报告强调人机协作是未来发展方向，并为不同需求用户提供了具体的模型选择建议。

至顶网科技行者 2025-10-15 10:08:39

阿里达摩院VACE：一个模型搞定所有视频创作，从文字到视频再到精细编辑全包了

阿里达摩院推出VACE系统，这是首个能够统一处理文字转视频、视频编辑、遮罩编辑等12种视频任务的AI模型。通过创新的视频条件单元(VCU)和上下文适配器架构，VACE不仅能单独完成各类视频生成编辑任务，还支持任务组合创造出传统方法无法实现的效果，为视频创作提供了革命性的一站式解决方案。

至顶网科技行者 2025-08-01 10:14:02

中科大团队让AI用两张照片就能"看懂"整个3D世界：稀疏视角重建技术的革命性突破

中科大团队开发了MeshSplat技术，仅用两张照片就能重建完整3D场景。该技术首次将2D高斯散点应用于稀疏视角表面重建，通过加权距离约束和法向预测网络显著提升重建质量。实验显示其性能比现有方法提升30%，在房地产、电商、文物保护等领域具有广泛应用前景。

至顶网科技行者 2025-09-02 09:31:47

上海多家顶尖学府首创同步视频音频生成技术：让AI同时"看见"和"听见"

这项由上海创新研究院、复旦大学、上海交通大学等机构联合完成的研究，首次实现了真正意义上的视频音频同步生成。MOVA系统拥有320亿参数，能够同时生成高质量的视频画面和完全匹配的音频内容，在唇音同步、多人对话、环境音效等方面都达到了行业领先水平，为AI内容创作开辟了全新的技术路径。

至顶网科技行者 2026-02-10 15:36:11

GLiClass：轻量级文本分类的全能新秀，从乌克兰基辅走向世界的AI突破

GLiClass是由乌克兰基辅Knowledgator工程公司开发的创新文本分类模型，基于GLiNER架构改进而成。该模型通过联合编码文本和标签，在单次前向传递中完成多标签分类，实现了准确性与效率的完美平衡。测试显示，GLiClass不仅在准确性上超越强基准模型5.5%，处理速度更是比传统交叉编码器快2.3-16倍，特别是在大标签集场景下优势明显。模型已开源并提供多个规模版本以适应不同应用需求。

至顶网科技行者 2025-08-14 12:44:58

南开大学联合团队：让AI如厨师般巧妙搭配文字和图片，构建首个大规模多模态对话数据集

南开大学研究团队创建了InterSyn——首个大规模多模态对话数据集，包含180万单轮和5万多轮样本，覆盖3500个话题。通过创新的SEIR迭代优化方法，显著提升了AI生成文图结合内容的质量。同时开发的SynJudge评价工具能从四个维度评估文图协调性，与人类判断偏差仅5%。实验证明该方法在文图协调性上提升52.1%，为构建更智能的多模态AI系统奠定了基础。

至顶网科技行者 2025-06-19 10:46:38

让AI炒股变得更聪明：哈佛大学等团队发明的"智能交易员"如何用对话模式赚钱

这是一项融合大语言模型与强化学习的金融交易AI创新研究。哈佛等知名院校团队开发的FLAG-TRADER系统让仅1.35亿参数的小型AI模型在股票和加密货币交易中超越了GPT-4等大型商业模型。该系统通过部分微调和夏普比率奖励机制，实现了既能理解复杂市场信息又能从交易实践中持续学习的智能交易决策，为AI在金融领域的应用开辟了新路径。

至顶网科技行者 2025-08-20 18:05:38

Adobe Research与德州大学联手破解AI视频生成新难题：让人工智能边做边学，告别错误累积

Adobe Research与德州大学联手开发"自我强迫"训练法，让AI在视频生成时边做边学，彻底解决传统方法中错误会越积越多的问题。这种创新训练方式实现了真正的实时视频生成，在单GPU上达到17帧每秒的处理速度和亚秒级延迟，为直播、游戏和实时交互应用开辟了全新可能性。研究团队还引入滚动键值缓存机制，实现了理论上无限长的视频生成能力。

至顶网科技行者 2025-06-16 09:34:19

上海AI实验室的新突破：让你用键盘控制的虚拟世界探险家YUME

上海AI实验库推出YUME系统，用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术，将复杂的三维控制简化为WASD键操作，并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力，不仅能处理真实场景，还能重现动漫、游戏等各种艺术风格的虚拟世界，为虚拟现实和交互娱乐领域提供了全新的技术路径。

至顶网科技行者 2025-07-28 15:33:14

黄仁勋全球记者会：英伟达正在转型为一家AI基础设施公司，中国为AI产业贡献了50%的研究员

在GTC2025大会上，英伟达CEO黄仁勋在一场至顶科技等全球媒体共同参与的记者会上表示， AI正在成为一个全新的制造业。AI不是传统意义上的软件开发，而是一场需要基础设施、能源和资本投入的产业革命。

至顶网高飞 2025-03-20 10:11:15

【万字长文】Python正在蚕食全世界

世界上有几百种编程语言，而真正流行的不过20余种，Python就是其中之一。多年前，Guido van Rossum创造了Python，成为了如今的「Python之父」。面对数百万人忠诚拥趸，Nick Heath与van Rossum共同探讨了Python的过去以及未来。

至顶网科技行者 2019-08-26 12:35:55

亚马逊Nova Premier能造出生化武器吗？三大风险领域全面安全评估揭秘

亚马逊发布Nova Premier AI模型的首个全面安全评估报告，针对化学生物武器、网络攻击和AI自主研发三大高风险领域进行了系统性测试。研究采用自动化基准测试和人工评估相结合的方法，并邀请第三方机构独立验证。结果显示Nova Premier虽然在各领域知识水平有所提升，但实际危险操作能力仍在安全阈值内，可安全向公众开放。

至顶网科技行者 2025-07-18 09:35:33

FusionAudio-1.2M：当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究

香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集，创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法，构建了包含120万高质量音频描述的大规模数据集。实验表明，使用该数据集训练的AI模型在音频理解和检索任务上显著超越现有方法，为智能语音助手、自动驾驶等领域带来重要应用前景。

至顶网科技行者 2025-06-11 07:48:46

英伟达联手斯坦福：一口气生成一分钟连贯视频，AI终于会讲故事了

英伟达与斯坦福等顶尖机构联合开发的TTT技术首次让AI学会"讲故事"，能生成长达一分钟的连贯视频。该技术采用"边做边学"的创新方法，让AI在生成视频时持续优化记忆能力，在人类评估中比现有最佳方法领先34个Elo积分，展现出革命性的长视频生成能力。

至顶网科技行者 2025-07-17 09:24:31

中科大团队打造"会呼吸会笑"的AI语音助手：让机器说话如人类般自然生动

香港中文大学（深圳）团队开发了NVSpeech系统，首次实现了对中文语音中笑声、叹息、呼吸等18种副语言声音的精确识别与合成。该系统构建了包含174,179条语音、总时长573.4小时的全球最大中文副语言数据集，让AI语音助手能够像人类一样"有声有色"地表达情感。

至顶网科技行者 2025-08-15 08:25:19

阿里巴巴发布Qwen-Image：让AI画出完美中文字的图像生成新时代

阿里巴巴Quen团队发布了图像生成模型Qwen-Image，在复杂文字渲染和精准图像编辑方面实现重大突破。该模型通过创新的数据处理流程和渐进式训练策略，不仅在英文文字渲染上表现出色，更在中文字符生成方面远超现有模型，准确率达到58.30%。同时具备多任务处理能力，可进行图像编辑、深度估计、新视角合成等操作，为AI图像生成技术开启新纪元。

至顶网科技行者 2025-10-10 10:28:35

中国科大推出VAREdit：让AI图片编辑变得又快又准的神器

中国科大联合HiDream.ai推出的VAREdit是首个基于视觉自回归模型的图像编辑系统，通过多尺度预测和尺度对齐参考模块，实现了比传统扩散模型更精准快速的编辑效果。在标准测试中，VAREdit的编辑质量比最强竞争对手提升30%以上，处理速度快2.2倍，能在1.2秒内完成高质量图像编辑，为AI图像处理领域开辟了全新的技术路径。

至顶网科技行者 2025-08-29 09:32:37

《数字经济洞察周报》2023年第28期 | 苹果发布搭载3nm A17 Pro芯片的iPhone 15 Pro（附机型对比）

苹果发布搭载3nm A17 Pro芯片的iPhone 15 Pro（附机型对比）

至顶网孙硕 2023-12-07 16:13:12

新加坡大学团队打造"影音同步魔法师"：让机器像导演一样拍出声画完美合一的视频

新加坡国立大学团队突破音视频同步生成技术难题，开发出JavisDiT系统，能像专业导演一样确保声画完美同步。该系统采用创新的双向交叉注意力机制和分层时空先验估计器，在包含10,140个复杂场景样本的JavisBench数据集上全面超越现有方法，为音视频内容创作开辟新可能。

至顶网科技行者 2025-07-15 11:36:57