搜索彩神APP官方最高代理内部邀请码【罔芷:——YB266·CN—

“女博士”张晴晴的硬核AI创业经：做数据难于做芯片

人们普遍认为，AI科学家每天的工作是构建高大上的模型，但其实绝大多数时间都用在了数据上，他们也想用好的数据帮助建模，但结果却是像围城一样——这是很多AI科学家共同的难题。

至顶网周雅 2023-02-26 23:38:42

2023年，我还留在互联网大厂

对于多数人来说，大厂或许仍是工作的最优解。但也不得不正视大厂的光环的确在褪去。经历了大厂一波又一波的裁员，留下来的人似乎成为了“幸运儿”，只是“幸运”并不一定，压力却是必然。今日推荐燃次元（ ID :chaintruth ) 一篇文章，那些留在大厂的人们。

至顶网至顶网码客人生频道 2023-01-09 10:22:42

后OpenStack时代的Kubernetes，如何摆脱难用的“帽子”

进入21世纪后，虚拟机技术进入相对成熟阶段，由于虚拟机的“笨重”，开发者们开始追求一种更加轻便的虚拟化技术。

至顶网业界供稿 2022-09-15 15:12:32

从看图说话到看视频聊天：Salesforce带来史上最强多模态理解新突破

本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准，首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线，展示了从专门化向通用化发展的重要趋势，为多媒体内容理解、智能搜索和人机交互带来突破性进展。

至顶网科技行者 2025-07-11 09:52:55

GLiNER2：小巧高效的信息提取神器，让AI文档处理从GPU"搬"到CPU

GLiNER2是Fastino AI开发的统一信息提取系统，仅用2亿参数就集成了命名实体识别、文本分类和层次化结构提取三大功能。该系统最大亮点是完全支持CPU运行，无需GPU显卡，处理速度比同类模型快40倍，准确率达到72%。采用Apache 2.0开源协议，用户可通过pip免费安装使用，为企业和个人提供了高效、安全、低成本的文档处理解决方案。

至顶网科技行者 2025-07-29 12:02:11

当年只有30人在训练AGI：Anthropic预训练负责人访谈的万字实录，曾经的AI实验室都是通才，现在大家都是专才

Y Combinator合伙人Ankit Gupta与Anthropic预训练负责人Nick Joseph最近进行了一次深度对话。

至顶网高飞 2025-10-09 11:27:15

中科院团队发布"万能评委"BaseReward：彻底解决AI多模态模型的"判官难题"

中科院团队发布BaseReward多模态奖励模型，通过系统性实验建立了构建高性能多模态奖励模型的完整方法论。该模型采用简洁的两层架构设计，在精心筛选的280万偏好数据上训练，在多个权威基准测试中创下新纪录，准确率提升超过11%。研究还发现纯文本数据能显著提升多模态判断能力的重要现象，为AI对齐技术发展提供了重要指导。

至顶网科技行者 2025-10-09 14:33:11

印度理工学院新突破：让小模型也能像大模型一样聪明，无需标注数据的AI视觉问答训练法

印度理工学院团队开发出MPA模型对等对齐器，这是一种革命性的AI训练方法，能让小型视觉语言模型在无需人工标注数据的情况下，通过大模型指导显著提升性能。该技术通过三步法实现知识传递：大模型自动出题答题、精准识别知识差距、针对性强化训练。实验显示小模型性能提升高达15.2%，成本仅为传统方法的几十分之一，为AI技术普及开辟新路径。

至顶网科技行者 2025-09-29 08:52:08

ACTalker：香港科技大学团队打造会表情的AI主播，让视频通话变得更自然

香港科技大学团队开发的ACTalker系统实现了多信号协同控制的说话头像生成突破，通过并行控制曼巴层和面具丢弃策略，让AI能同时根据音频和面部动作生成自然的说话视频，在语音同步性和表情控制精度方面全面超越现有方法，为虚拟交互应用开辟了新的可能性。

至顶网科技行者 2025-07-15 10:08:03

上海AI实验室携手港中文首创"隐喻星辰"：让AI读懂图像背后的深层含义

这项研究首次提出MetaphorStar框架，专门解决AI系统无法理解图像隐喻含义的问题。通过创新的TFQ格式和强化学习方法，让AI从只能识别"一个人站在路口"提升到理解"人生选择"的深层含义。在基准测试中性能平均提升82.6%，为开发具有深层认知能力的智能系统开辟了新路径。

至顶网科技行者 2026-02-14 10:31:21

北京大学联合字节跳动推出MoVieS：用一秒钟就能从单镜头视频中生成4D动态场景的神奇技术

北京大学联合字节跳动推出MoVieS技术，能够从单镜头视频中快速重建4D动态场景。该系统采用"动态溅射像素"概念，统一处理场景外观、几何和运动信息，在一秒内完成传统方法需要数小时的重建任务。技术支持新视角合成、3D点追踪、场景流估计等多种应用，在保持高质量的同时实现数量级的速度提升。

至顶网科技行者 2025-07-22 09:23:44

创新技术与业务场景融合，星环科技大数据智能化、多模态、平民化

5月26日，“向星力·未来数据技术峰会（FDTC）”在上海成功举办。星环科技创始人、CEO孙元浩表示，未来人人都是数据科学家，人类与数据的交互方式将发生重大变革，语言、视频等自然语言的交互方式将逐渐普及，每个人都将需要一个“虚拟业务助手”。

至顶网业界供稿 2023-05-26 15:34:42

Meta团队如何让AI学会全世界的语言？重新定义多语言视觉理解的全球化突破

Meta AI团队联合MIT等机构开发的MetaCLIP 2系统，首次实现了真正的全球化AI视觉理解。该系统支持300多种语言，不仅突破了传统多语言AI的"诅咒"问题，还让英语性能提升0.8%，在多项国际测试中创下新纪录。通过创新的训练策略和开源架构，为构建真正服务全人类的AI技术奠定了基础。

至顶网科技行者 2025-08-06 11:08:48

星辰大海引航：大型语言模型如何从奖励中学习提升自己

想象一下航海时代的探险家们，他们在茫茫大海上航行时，依靠天空中的星辰来指引方向。同样，当今的大型语言模型也需要某种"指引之星"帮助它们朝着正确的方向发展。这个指引之星，就是研究人员所说的"奖励信号"。

至顶网科技行者 2025-05-13 15:27:35

AI的视觉盲点：伊利诺伊大学团队揭示多模态推理中的"看不见"问题

伊利诺伊大学研究团队发现AI在多模态推理中存在严重的视觉理解缺陷，67%的错误源于对图像信息的误解。他们开发了PAPO方法，通过图像遮挡技术强迫AI真正使用视觉信息，实现了4.4%的性能提升。这项研究对AI在教育、医疗、自动驾驶等领域的可靠应用具有重要意义。

至顶网科技行者 2025-07-18 09:37:47

16个数字化转型成功的真实案例

各种企业正在越来越多地推出数字化举措，以扩大或构建旨在提高业务效率或收入增长的数字化功能。随着许多数字化转型成功故事的出现，这一趋势正在增加。

至顶网 cio.com 2018-02-26 18:32:33

机器人也能预测未来？上海AI实验室打造"会做梦"的机器人大脑

上海AI实验室等机构联合开发的EnerVerse系统，首次让机器人具备了"想象未来"的能力。通过将视频生成技术与机器人控制结合，该系统能够预测操作过程并生成相应动作。核心创新包括块状自回归生成、自由锚点视角和4D数据生成引擎，在LIBERO基准测试中达到最佳水平，并在真实环境中成功完成复杂操作任务。

至顶网科技行者 2025-09-17 13:28:55

有想象的地方，就有视频云

2021,阿里云视频云全景创新峰会,努力尝试站在近景和远景之处,全景观察这个时代的超视频化课题。

至顶网业界供稿 2021-07-15 17:20:50

澳门大学：图像生成也要"精益求精"，AI学会自我优化条件信息

澳门大学研究团队针对自回归图像生成中的条件错误累积问题，提出了基于最优传输理论的创新解决方案。研究发现自回归模型具备自我纠错能力，条件错误影响呈指数衰减，但仍存在"条件不一致"问题。团队创新性地运用瓦瑟斯坦梯度流方法优化条件信息，在ImageNet数据集上取得显著性能提升，为AI图像生成质量控制开辟了新方向。

至顶网科技行者 2026-02-12 13:32:13

MIT和Jina AI团队联手打造：小身材大能量的代码搜索新利器

MIT和Jina AI联合开发的jina-code-embeddings代码嵌入模型，通过改造预训练代码生成模型实现高效代码检索。该模型支持自然语言查询代码、技术问答和跨语言代码搜索，尽管参数规模较小（0.5B-1.5B），但在25项基准测试中表现优异，为AI辅助编程和智能开发环境提供了高性价比的基础工具。

至顶网科技行者 2025-09-05 11:26:15