搜索北京pk精准人工计划软件【網纸——YB233典CN—

阿里达摩院VACE：一个模型搞定所有视频创作，从文字到视频再到精细编辑全包了

阿里达摩院推出VACE系统，这是首个能够统一处理文字转视频、视频编辑、遮罩编辑等12种视频任务的AI模型。通过创新的视频条件单元(VCU)和上下文适配器架构，VACE不仅能单独完成各类视频生成编辑任务，还支持任务组合创造出传统方法无法实现的效果，为视频创作提供了革命性的一站式解决方案。

至顶网科技行者 2025-08-01 10:14:02

2022企业经营不可错过的数据驱动八大趋势

我们正在从流程驱动走向一个由数据驱动商业变革的全新时代。数据驱动成为新时代企业运作的核心特征，也是现代企业数字化转型的主线和关键。

至顶网元年研究院 2022-03-01 18:49:01

EOC-Bench: 多模态大语言模型能否识别、回忆和预测第一人称视角下的物体？

这项研究介绍了EOC-Bench，一个创新基准测试，专门评估多模态大语言模型在第一人称视角场景中对物体的认知能力。研究团队从三个时间维度（过去、现在和未来）构建了3,277个问答对，涵盖11个细粒度评估维度，创新性地使用视觉提示解决物体引用问题。评估结果显示，即使最先进的模型如GPT-4o在物体时间感知方面也显著落后于人类，特别是在绝对时间感知上。这一研究为发展更强大的体感AI系统提供了重要参考，对增强现实和机器人技术等领域具有深远影响。

至顶网科技行者 2025-06-09 14:35:11

ByteDance智能创作团队推出划时代海报设计AI：CreatiPoster让人人都能成为设计师

ByteDance智能创作团队推出CreatiPoster，这是一个革命性的AI海报设计系统，用户只需文字描述就能生成专业级多图层可编辑海报。系统采用"双脑"架构：协议模型负责理解需求并制定详细设计方案，背景模型负责创造匹配的视觉背景。支持多种交互方式，包括纯文字输入、图片素材上传、画布编辑等。在与商业平台的对比评估中表现优异，并开源了10万样本数据集，真正实现了AI设计工具的民主化。

至顶网科技行者 2025-06-18 09:53:30

中科大团队让AI用两张照片就能"看懂"整个3D世界：稀疏视角重建技术的革命性突破

中科大团队开发了MeshSplat技术，仅用两张照片就能重建完整3D场景。该技术首次将2D高斯散点应用于稀疏视角表面重建，通过加权距离约束和法向预测网络显著提升重建质量。实验显示其性能比现有方法提升30%，在房地产、电商、文物保护等领域具有广泛应用前景。

至顶网科技行者 2025-09-02 09:31:47

UMoE：让AI更聪明的"专家分工制"——东京科学技术大学等联合推出统一混合专家架构

这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构，通过重新设计注意力机制，实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法，同时保持了较低的计算开销，为大语言模型的高效扩展提供了新思路。

至顶网科技行者 2025-07-08 13:52:30

Atla公司发布Selene Mini：一个8B参数的强大语言模型评估器，性能超越GPT-4o-mini

Atla公司发布Selene Mini，这是一个仅有80亿参数的AI评估模型，却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略，该模型不仅能准确评判文本质量，还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源，为AI评估技术的普及和发展做出贡献。

至顶网科技行者 2025-09-15 14:44:11

明灯科技团队打造智能GUI助手：让电脑像人一样"看懂"界面并自动操作

明灯科技团队开发了名为Mano的智能GUI助手系统，能够像人一样"看懂"电脑界面并自动执行复杂操作任务。该系统采用三阶段训练方法，结合基础技能培训、策略优化和实战适应，在Mind2Web和OSWorld测试中取得显著性能提升。系统还包含智能数据采集、验证和身份认证等辅助模块，通过持续学习机制不断自我改进，为GUI自动化领域带来重要突破。

至顶网科技行者 2025-09-29 09:01:44

史上最全面的AI图像生成评测基准：上海交大联合StepFun推出OneIG-Bench，彻底改变AI作画评测游戏规则

上海交通大学与StepFun联合推出的OneIG-Bench是AI图像生成领域首个全维度评测基准，涵盖语义对齐、文字渲染、知识推理、风格化、多语言等六大维度，包含超过2400个测试案例。该研究对19个顶级AI模型进行了史上最全面的对比评测，发现GPT-4o综合表现最佳，Seedream 3.0在文字渲染方面独领风骚，揭示了当前AI模型的优势与不足，为未来技术发展指明了方向。

至顶网科技行者 2025-06-12 13:06:18

马里兰大学推出DynaGuard：让AI守门员学会理解你的专属规则

马里兰大学研究团队推出DynaGuard，这是首个能理解用户自定义规则的AI守护模型。不同于只能识别预设类别的传统系统，DynaGuard能处理自然语言编写的任何规则，并提供详细解释帮助AI自我纠正。该模型基于40000个场景的DynaBench数据集训练，在传统安全任务和定制规则处理上都表现优异，为AI安全技术开辟了新方向。

至顶网科技行者 2025-09-22 10:28:15

欢迎来到不为人知的医疗朋克世界

Grindfest是以生物学中的“研磨（grinding）”命名的，或许我可以将其描述为一种医疗朋克亚文化。

至顶网科技行者 2018-05-28 11:58:32

“算透”用户，抖音为什么让人沉迷？

抖音成为2020年1月美国下载数量最高的应用。

至顶网科技行者 2020-06-10 14:51:20

阿里巴巴团队破解AI视觉理解难题：让机器像人一样"看懂"几何图形

阿里巴巴达摩院联合南洋理工大学的研究团队发现，当前AI模型在几何推理中频繁出错的根本原因是视觉感知能力不足。他们提出了分阶段训练框架，先强化AI的基础视觉感知能力，再进行复杂推理训练。实验显示，这种方法使3B参数模型在几何推理任务上准确率提升9.7%，接近GPT-4o的表现水平，为AI视觉理解能力提升提供了新思路。

至顶网科技行者 2025-09-28 09:51:33

能看会听还记得住！ByteDance推出超级AI助手，能像人一样积累记忆的M3-Agent

ByteDance研究团队推出的M3-Agent是首个具备长期记忆能力的多模态AI代理。它能同时处理视频、音频信息，像人类一样积累经验和知识。系统采用情节记忆和语义记忆双重机制，以实体为中心组织信息，并通过多轮推理解决复杂问题。在专门构建的M3-Bench测试中，M3-Agent全面超越现有技术，为智能助手的发展开辟了新方向。

至顶网科技行者 2025-08-18 13:56:32

ByteDance推出Multi-SWE-bench：让AI程序员学会修复全球七种编程语言的Bug

ByteDance研究团队构建了Multi-SWE-bench，这是首个覆盖七种主流编程语言的AI编程能力评测平台，包含1632个人工验证的真实Bug修复案例。测试显示现有顶级AI模型存在严重的语言偏见，在Python以外语言上表现大幅下降。研究同时启动了Multi-SWE-RL开源社区，发布4723个训练实例，为开发通用AI编程助手提供基础设施。

至顶网科技行者 2025-07-15 10:09:37

CES 2024 | 除了生成式AI，CES 2024还有这些值得关注的好产品

除了AI、汽车、手机壳外，今年的CES还有不少值得留意的新点子。

至顶网刘文轩 2024-01-15 12:44:48

哈佛研究中心探讨人类智能与AI计算智能是否本质相同

哈佛大学伯克曼·克莱因中心探讨人类智能是否实际上就是一种计算智能形式。谷歌技术与社会首席技术官在秋季演讲系列中力挺"大脑即计算机"观点，认为大脑不仅像计算机，本身就是计算机。该理论将大脑比作预测性处理器，类似大语言模型通过预测下一个词元工作。支持者认为通过扩大计算规模可实现AGI，但也有声音质疑当前架构可能遇到瓶颈。研究者希望通过破解AI内部机制来理解人类思维。

至顶网 Forbes 2025-09-29 08:16:33

北大与腾讯联手破解AI智能体难题：让机器像人类团队一样协作思考

这项由北京大学主导、联合多家国际顶尖机构完成的研究，首次系统性地梳理了大语言模型智能体领域的完整技术图谱。研究提出了"构建-协作-进化"的统一框架，深入分析了智能体的技术架构、应用场景和发展挑战，为理解这一前沿技术提供了重要指南，对推动AI智能体技术的健康发展具有重要意义。

至顶网科技行者 2025-08-01 14:44:30

生成式AI在律师事务所中大行其道，按小时计费的服务形式或迎来终结？

过去十多年来，律师事务所一直使用机器学习和AI工具来辅助这个发现过程，帮助其追查纸质记录和数字内容。但直到两年之前OpenAI的生成式对话聊天机器人ChatGPT问世之后，这项技术才开始真正普及且易于使用，甚至刚刚从法学院毕业的新人助理都能依靠它完成电子取证。

至顶网至顶网软件与服务频道 2024-10-24 22:12:48

对机器人征税，它们就不来抢你的工作了吗？

麻省理工学院经济学家Arnaud Costinot与Iván Werning探讨拟议的“机器人税”。

至顶网 TechCrunch 2023-09-15 08:29:32