搜一下
用了 0.110856秒,为您找到
彩神
APP
官方
最高
代理
内部
邀请
码罔芷
YB266CN
驻测
相关内容8776 条
“女博士”张晴晴的硬核AI创业经:做数据难于做芯片
人们普遍认为,AI科学家每天的工作是构建高大上的模型,但其实绝大多数时间都用在了数据上,他们也想用好的数据帮助建模,但结果却是像围城一样——这是很多AI科学家共同的难题。
至顶网
周雅 2023-02-26 23:38:42
2023年,我还留在互联网大厂
对于多数人来说,大厂或许仍是工作的最优解。但也不得不正视大厂的光环的确在褪去。经历了大厂一波又一波的裁员,留下来的人似乎成为了“幸运儿”,只是“幸运”并不一定,压力却是必然。今日推荐 燃次元( ID :chaintruth ) 一篇文章,那些留在大厂的人们。
至顶网
至顶网码客人生频道 2023-01-09 10:22:42
后OpenStack时代的Kubernetes,如何摆脱难用的“帽子”
进入21世纪后,虚拟机技术进入相对成熟阶段,由于虚拟机的“笨重”,开发者们开始追求一种更加轻便的虚拟化技术。
至顶网
业界供稿 2022-09-15 15:12:32
从看图说话到看视频聊天:Salesforce带来史上最强多模态理解新突破
本研究提出了VLM2Vec-V2多模态嵌入模型和MMEB-V2评估基准,首次实现对文本、图片、视频和文档的统一理解。该模型在78个任务上全面领先现有基线,展示了从专门化向通用化发展的重要趋势,为多媒体内容理解、智能搜索和人机交互带来突破性进展。
至顶网
科技行者 2025-07-11 09:52:55
GLiNER2:小巧高效的信息提取神器,让AI文档处理从GPU"搬"到CPU
GLiNER2是Fastino AI开发的统一信息提取系统,仅用2亿参数就集成了命名实体识别、文本分类和层次化结构提取三大功能。该系统最大亮点是完全支持CPU运行,无需GPU显卡,处理速度比同类模型快40倍,准确率达到72%。采用Apache 2.0开源协议,用户可通过pip免费安装使用,为企业和个人提供了高效、安全、低成本的文档处理解决方案。
至顶网
科技行者 2025-07-29 12:02:11
当年只有30人在训练AGI:Anthropic预训练负责人访谈的万字实录,曾经的AI实验室都是通才,现在大家都是专才
Y Combinator合伙人Ankit Gupta与Anthropic预训练负责人Nick Joseph最近进行了一次深度对话。
至顶网
高飞 2025-10-09 11:27:15
中科院团队发布"万能评委"BaseReward:彻底解决AI多模态模型的"判官难题"
中科院团队发布BaseReward多模态奖励模型,通过系统性实验建立了构建高性能多模态奖励模型的完整方法论。该模型采用简洁的两层架构设计,在精心筛选的280万偏好数据上训练,在多个权威基准测试中创下新纪录,准确率提升超过11%。研究还发现纯文本数据能显著提升多模态判断能力的重要现象,为AI对齐技术发展提供了重要指导。
至顶网
科技行者 2025-10-09 14:33:11
印度理工学院新突破:让小模型也能像大模型一样聪明,无需标注数据的AI视觉问答训练法
印度理工学院团队开发出MPA模型对等对齐器,这是一种革命性的AI训练方法,能让小型视觉语言模型在无需人工标注数据的情况下,通过大模型指导显著提升性能。该技术通过三步法实现知识传递:大模型自动出题答题、精准识别知识差距、针对性强化训练。实验显示小模型性能提升高达15.2%,成本仅为传统方法的几十分之一,为AI技术普及开辟新路径。
至顶网
科技行者 2025-09-29 08:52:08
ACTalker:香港科技大学团队打造会表情的AI主播,让视频通话变得更自然
香港科技大学团队开发的ACTalker系统实现了多信号协同控制的说话头像生成突破,通过并行控制曼巴层和面具丢弃策略,让AI能同时根据音频和面部动作生成自然的说话视频,在语音同步性和表情控制精度方面全面超越现有方法,为虚拟交互应用开辟了新的可能性。
至顶网
科技行者 2025-07-15 10:08:03
上海AI实验室携手港中文首创"隐喻星辰":让AI读懂图像背后的深层含义
这项研究首次提出MetaphorStar框架,专门解决AI系统无法理解图像隐喻含义的问题。通过创新的TFQ格式和强化学习方法,让AI从只能识别"一个人站在路口"提升到理解"人生选择"的深层含义。在基准测试中性能平均提升82.6%,为开发具有深层认知能力的智能系统开辟了新路径。
至顶网
科技行者 2026-02-14 10:31:21
北京大学联合字节跳动推出MoVieS:用一秒钟就能从单镜头视频中生成4D动态场景的神奇技术
北京大学联合字节跳动推出MoVieS技术,能够从单镜头视频中快速重建4D动态场景。该系统采用"动态溅射像素"概念,统一处理场景外观、几何和运动信息,在一秒内完成传统方法需要数小时的重建任务。技术支持新视角合成、3D点追踪、场景流估计等多种应用,在保持高质量的同时实现数量级的速度提升。
至顶网
科技行者 2025-07-22 09:23:44
创新技术与业务场景融合,星环科技大数据智能化、多模态、平民化
5月26日,“向星力·未来数据技术峰会(FDTC)”在上海成功举办。星环科技创始人、CEO孙元浩表示,未来人人都是数据科学家,人类与数据的交互方式将发生重大变革,语言、视频等自然语言的交互方式将逐渐普及,每个人都将需要一个“虚拟业务助手”。
至顶网
业界供稿 2023-05-26 15:34:42
Meta团队如何让AI学会全世界的语言?重新定义多语言视觉理解的全球化突破
Meta AI团队联合MIT等机构开发的MetaCLIP 2系统,首次实现了真正的全球化AI视觉理解。该系统支持300多种语言,不仅突破了传统多语言AI的"诅咒"问题,还让英语性能提升0.8%,在多项国际测试中创下新纪录。通过创新的训练策略和开源架构,为构建真正服务全人类的AI技术奠定了基础。
至顶网
科技行者 2025-08-06 11:08:48
星辰大海引航:大型语言模型如何从奖励中学习提升自己
想象一下航海时代的探险家们,他们在茫茫大海上航行时,依靠天空中的星辰来指引方向。同样,当今的大型语言模型也需要某种"指引之星"帮助它们朝着正确的方向发展。这个指引之星,就是研究人员所说的"奖励信号"。
至顶网
科技行者 2025-05-13 15:27:35
AI的视觉盲点:伊利诺伊大学团队揭示多模态推理中的"看不见"问题
伊利诺伊大学研究团队发现AI在多模态推理中存在严重的视觉理解缺陷,67%的错误源于对图像信息的误解。他们开发了PAPO方法,通过图像遮挡技术强迫AI真正使用视觉信息,实现了4.4%的性能提升。这项研究对AI在教育、医疗、自动驾驶等领域的可靠应用具有重要意义。
至顶网
科技行者 2025-07-18 09:37:47
16个数字化转型成功的真实案例
各种企业正在越来越多地推出数字化举措,以扩大或构建旨在提高业务效率或收入增长的数字化功能。随着许多数字化转型成功故事的出现,这一趋势正在增加。
至顶网
cio.com 2018-02-26 18:32:33
机器人也能预测未来?上海AI实验室打造"会做梦"的机器人大脑
上海AI实验室等机构联合开发的EnerVerse系统,首次让机器人具备了"想象未来"的能力。通过将视频生成技术与机器人控制结合,该系统能够预测操作过程并生成相应动作。核心创新包括块状自回归生成、自由锚点视角和4D数据生成引擎,在LIBERO基准测试中达到最佳水平,并在真实环境中成功完成复杂操作任务。
至顶网
科技行者 2025-09-17 13:28:55
有想象的地方,就有视频云
2021,阿里云视频云全景创新峰会,努力尝试站在近景和远景之处,全景观察这个时代的超视频化课题。
至顶网
业界供稿 2021-07-15 17:20:50
澳门大学:图像生成也要"精益求精",AI学会自我优化条件信息
澳门大学研究团队针对自回归图像生成中的条件错误累积问题,提出了基于最优传输理论的创新解决方案。研究发现自回归模型具备自我纠错能力,条件错误影响呈指数衰减,但仍存在"条件不一致"问题。团队创新性地运用瓦瑟斯坦梯度流方法优化条件信息,在ImageNet数据集上取得显著性能提升,为AI图像生成质量控制开辟了新方向。
至顶网
科技行者 2026-02-12 13:32:13
MIT和Jina AI团队联手打造:小身材大能量的代码搜索新利器
MIT和Jina AI联合开发的jina-code-embeddings代码嵌入模型,通过改造预训练代码生成模型实现高效代码检索。该模型支持自然语言查询代码、技术问答和跨语言代码搜索,尽管参数规模较小(0.5B-1.5B),但在25项基准测试中表现优异,为AI辅助编程和智能开发环境提供了高性价比的基础工具。
至顶网
科技行者 2025-09-05 11:26:15
<
上一页
418
419
420
421
422
423
424
425
426
427
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号