搜一下
用了 0.522445秒,为您找到
mg
娱乐
公司
什么
網纸
YB233
相关内容20983 条
抖音团队打造全新视觉语言AI:SAIL-VL2以小博大,2B参数也能媲美大模型
抖音SAIL团队联合新加坡国立大学开发的SAIL-VL2多模态AI模型,以2B-8B的紧凑参数实现了超越大型模型的性能。通过精心的数据筛选、渐进式训练和架构优化,在106个数据集测试中表现卓越,其中2B版本在4B以下开源模型中排名第一,8B-Thinking版本在推理任务上达到开源第一。该模型证明了"小而精"的发展路径,为AI技术的普及和高效部署提供了新思路。
至顶网
科技行者 2025-09-29 14:30:19
StepFun团队发布NextStep-1:让机器像人类一样逐步生成图像的新突破
StepFun团队发布的NextStep-1代表了AI图像生成领域的重要突破,采用自回归方式逐步生成图像,像艺术家作画般一点点构建视觉内容。这个14B参数的模型在多项测试中表现优异,不仅能高质量生成图像,还具备强大的编辑能力,为AI创作工具的发展开辟了新方向。
至顶网
科技行者 2025-08-19 10:19:29
性能炸裂 深度评测RTX 3080新卡皇
看看在实际测试中GeForce RTX 3080的表现。
至顶网
风望月 2020-09-17 17:39:49
人工智能终于学会说话了?阿里巴巴等机构突破语音理解技术壁垒!
阿里巴巴等机构联合发布LLaSO框架,这是首个完全开放的端到端语音理解系统。该框架包含2550万训练样本、20种语音任务,支持多模态交互,在标准化评估中获得0.72分,超越同类系统。LLaSO不仅提供完整数据和代码,还建立了统一评估标准,为语音AI研究提供了重要基础设施,推动了从语音识别向全面语音理解的技术跃升。
至顶网
科技行者 2025-08-29 09:32:22
SAE-Tuning:南加州大学团队让AI推理能力像积木一样灵活组装
南加州大学研究团队开发了革命性的SAE-Tuning技术,能够像"移植手术"一样将AI推理能力从一个模型转移到另一个模型。该方法将传统推理训练的成本从数千美元降至约1美元,时间从数百小时缩短至20分钟,效果却毫不逊色。更令人惊讶的是,这种推理能力具有跨领域通用性和模块化特性,可以像插件一样即插即用,为AI能力的民主化和模块化发展开辟了新道路。
至顶网
科技行者 2025-06-18 09:53:08
像人类需要疫苗一样,AI模型也需要"免疫":Vector研究所提出模型免疫方法对抗虚假信息
这项由加拿大Vector研究所领导的研究提出了"模型免疫"概念,通过让AI模型在训练过程中接触已标记的虚假信息,增强其辨别和拒绝类似虚假内容的能力。类比人类疫苗接种原理,研究者在微调阶段向模型注入约5-10%的已标记错误内容作为"疫苗"。初步实验表明,免疫后的模型处理虚假信息的能力从60%提升至78%,同时保持了常规任务性能。研究团队还设计了严格的伦理与治理框架,确保虚假内容使用安全。这一方法为提高AI系统的事实准确性提供了预防性解决方案。
至顶网
科技行者 2025-06-02 12:17:13
天津大学团队让AI生成动作快如闪电:MotionFlux让虚拟角色动起来只需毫秒
天津大学研究团队开发的MotionFlux系统通过矫正流匹配技术和TAPO偏好对齐优化,实现了毫秒级的实时文字到动作生成。该系统在保持高质量动作生成的同时,将推理速度提升了数千倍,在语义对齐准确率上也显著优于现有方法,为游戏、虚拟现实、教育培训等领域的实时应用奠定了技术基础。
至顶网
科技行者 2025-09-03 14:09:55
微软发布Phi-4-Mini:3.8B参数的"小钢炮",多模态表现堪比大模型两倍体量
微软发布Phi-4-Mini多模态语言模型,仅3.8亿参数却能媲美两倍规模模型性能。该模型采用创新"混合LoRA"技术,支持文本、图像、语音多模态输入,在数学推理、编程、语音识别等任务中表现出色,在OpenASR榜单排名第一。这种"小而精"设计理念为AI普及化提供新思路,使强大AI功能可在消费级设备运行。
至顶网
科技行者 2025-08-04 10:00:34
瑞士AI联盟发布全球首个真正开源的大型语言模型:Apertus如何用15万亿字符数据改写AI训练规则
瑞士AI联盟发布全球首个真正开源的大型语言模型Apertus,在15万亿字符、1811种语言数据上训练。该模型采用创新的"金鱼损失"技术防止逐字记忆,严格遵循数据合规标准,提供80亿和700亿参数版本。研究团队完全公开训练代码、数据处理脚本等所有技术细节,树立了透明、可信赖的AI开发新标准。
至顶网
科技行者 2025-10-13 08:56:53
重新定义机器人双臂协作:上海AI实验室等机构推出RoboTwin 2.0,让机器人像人类一样灵活操作
这项由上海交通大学、香港大学、上海AI实验室等16个机构联合完成的突破性研究,推出了RoboTwin 2.0智能机器人训练系统。该系统通过自动代码生成、全方位环境随机化和个性化适应策略,让机器人能在虚拟世界中学会复杂双手协作技能并成功转移到真实环境。实验显示真实世界任务成功率提升367%,完全开源共享推动整个机器人学界发展。
至顶网
科技行者 2025-06-30 11:05:44
大语言模型的推理时间计算革命:如何让AI像人类一样慢慢思考
这是首个全面梳理AI深度思考技术的权威调研,由8所国际知名院校联合完成。研究建立了四维分析框架,系统阐述了让AI像人类一样慢慢思考的技术原理、实现方法、应用场景和评估标准,为这一革命性技术的发展与应用提供了完整的理论指导和实践路径。
至顶网
科技行者 2025-07-15 11:35:05
基金会AI用"万亿级"网络安全数据训练出首个专业安全助手,竟能读懂黑客心思
Cisco基金会AI团队开发出全球首个网络安全专业对话AI助手Foundation-Sec-8B-Instruct,基于Llama 3.1架构并用50亿网络安全词汇训练。该AI助手在专业测试中超越GPT-4o-mini等大型模型,同时具备出色的对话能力和安全防护机制,能识别99%的恶意请求。已开源发布,为网络安全行业提供了accessible的专业智能助手解决方案。
至顶网
科技行者 2025-08-07 14:16:10
EleutherAI和英国AI安全研究所联手揭秘:从源头让AI拒绝危险知识的革命性方法
这项由EleutherAI和英国AI安全研究所合作完成的研究提出了革命性的AI安全解决方案——通过在训练阶段过滤危险内容来构建本质安全的AI模型。研究团队开发了高效的数据过滤系统,成功训练出能够抵抗强力对抗攻击的AI模型,在保持通用能力的同时实现了前所未有的安全性,为开源AI模型的安全发展提供了切实可行的技术路径。
至顶网
科技行者 2025-10-11 10:01:10
机器人学会"三重思考":清华大学让机器人拥有了分层视觉理解能力
清华大学研究团队开发出H3DP系统,让机器人具备了类似人类的"三重分层思考"能力。该系统通过深度感知分层、多尺度视觉表征和分层动作生成三个层次,实现了视觉感知与动作执行的深度融合。在44个仿真任务中平均提升27.5%性能,在真实世界复杂操作中提升32.3%。这项技术为机器人在杂乱环境中的精确操作和家庭服务应用奠定了重要基础。
至顶网
科技行者 2025-07-09 09:42:06
纽约大学团队重新定义机器人学习:用"接触点"替代语言指令,让机器人更懂物理世界
纽约大学等多家机构联合研究提出了接触锚定策略,用物理接触点替代语言指令来训练机器人。该方法仅用23小时演示数据就实现了抓取、开启和关闭三种基本操作,在零样本评估中比现有方法性能高出56%。研究团队还开发了轻量级仿真环境EgoGym加速模型迭代,并在多个机器人平台上验证了跨平台兼容性。这项工作为资源受限环境下的机器人学习提供了高效解决方案。
至顶网
科技行者 2026-02-12 13:27:39
华为云大数据轻模式体验:忘掉底层烦恼,专注数据开发
华为云基于华为IT流程数据治理方法论推出华为云大数据轻量级解决方案,配合华为云资产可以轻资源、轻开发、轻部署、轻运维地快速构建数据治理体系
至顶网
业界供稿 2022-03-07 12:14:27
约翰内斯开普勒大学突破:让计算机像人脑一样处理多维信息的神奇技术
这项由奥地利约翰内斯开普勒大学团队开发的pLSTM技术,创新性地解决了人工智能在处理多维数据时的核心难题。通过引入源门、转换门和标记门三种机制,实现了真正的多维并行信息处理。在箭头指向外推任务中展现出优异的泛化能力,在图像识别和分子图谱分析等实际应用中也显示出强大潜力,为构建更智能的多维信息处理系统开辟了新路径。
至顶网
科技行者 2025-06-19 12:53:35
卡内基梅隆大学新突破:让AI学会"看懂"天空中的汽车,再也不用担心航拍车辆识别困难了
卡内基梅隆大学研究团队开发了一种创新的航拍图像车辆检测技术,通过生成式AI和跨域适应解决了不同地区环境差异导致的检测性能下降问题。该方法利用扩散模型生成合成训练数据,结合多通道注意力机制实现精确标注,在多个数据集上相较现有方法提升显著,为智能交通、城市规划、应急响应等领域提供了实用的技术解决方案,并贡献了两个高质量的航拍车辆检测数据集。
至顶网
科技行者 2025-08-06 11:07:32
风电场的"智能医生":如何让风力发电机更聪明地预测故障
本研究通过访谈五位风电专业人士,发现预测维护模型虽能有效减少重大故障停机时间约20%,但在识别渐进性小故障方面存在不足,同时面临假阳性、传感器可靠性和新旧系统整合等挑战。数字孪生、SCADA系统等先进技术显著提升了运维效率,但仍需在AI算法优化、实时数据整合等方面持续改进。
至顶网
科技行者 2025-06-30 10:51:53
谷歌揭开安卓系统的“未来面纱”:让Android界面有情感,让Gemini模型无处不在
在Google I/O(谷歌开发者大会)前夕,谷歌全球安卓团队的核心成员们,提前组织了一场全球媒体沟通会,剧透了安卓系统的未来新动向。科技行者TechWalker受邀参加了此次活动。
至顶网
周雅 2025-05-14 21:41:03
<
上一页
1038
1039
1040
1041
1042
1043
1044
1045
1046
1047
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号