搜一下
用了 0.056452秒,为您找到
捕鱼
达人
ios
破解版
游戏
網纸
YB233
相关内容4686 条
机器人也能预测未来?上海AI实验室打造"会做梦"的机器人大脑
上海AI实验室等机构联合开发的EnerVerse系统,首次让机器人具备了"想象未来"的能力。通过将视频生成技术与机器人控制结合,该系统能够预测操作过程并生成相应动作。核心创新包括块状自回归生成、自由锚点视角和4D数据生成引擎,在LIBERO基准测试中达到最佳水平,并在真实环境中成功完成复杂操作任务。
至顶网
科技行者 2025-09-17 13:28:55
有想象的地方,就有视频云
2021,阿里云视频云全景创新峰会,努力尝试站在近景和远景之处,全景观察这个时代的超视频化课题。
至顶网
业界供稿 2021-07-15 17:20:50
俄罗斯研究团队推出光流估计新方法:让超高清视频分析更省内存、更精准
俄罗斯莫斯科国立大学研究团队开发出MEMFOF光流估计新方法,在保持顶尖精度的同时将1080p视频分析的GPU内存消耗从8GB降至2GB,实现约4倍内存节省。该方法通过三帧策略、相关性体积优化和高分辨率训练在多个国际基准测试中取得第一名成绩,为高清视频分析技术的普及奠定基础。
至顶网
科技行者 2025-07-03 10:01:43
HTC VIVE发布多款高品质虚拟现实产品,以“软硬双擎”驱动VR新纪元
HTC正式推出全能VR一体机VIVE FOCUS 3和革新专业级PC-VR VIVE PRO 2,发布VIVE BUSINESS商用平台,为商用和消费者VR设定了新的基准。
至顶网
业界供稿 2021-05-12 10:20:43
MIT和Jina AI团队联手打造:小身材大能量的代码搜索新利器
MIT和Jina AI联合开发的jina-code-embeddings代码嵌入模型,通过改造预训练代码生成模型实现高效代码检索。该模型支持自然语言查询代码、技术问答和跨语言代码搜索,尽管参数规模较小(0.5B-1.5B),但在25项基准测试中表现优异,为AI辅助编程和智能开发环境提供了高性价比的基础工具。
至顶网
科技行者 2025-09-05 11:26:15
ByteDance种子实验室重磅推出VeOmni:让AI训练像搭积木一样简单的全新框架
ByteDance种子实验室推出VeOmni全模态AI训练框架,通过模块化设计和分布式优化策略,解决了同时训练处理文字、图像、视频、音频等多种数据类型AI模型的技术难题。该框架让300亿参数模型在128个GPU上实现每秒2800+ tokens处理速度,支持16万长度序列,在与主流框架对比中展现显著性能优势。
至顶网
科技行者 2025-08-07 14:14:57
突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"
西湖大学研究团队发表突破性论文,提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上,同时保持90%以上的准确率,有望解决当前AI系统"记忆不够用"的核心问题,为智能手机、医疗影像、自动驾驶等领域带来重大突破。
至顶网
科技行者 2025-08-04 13:34:06
万字梳理中国AIGC产业峰会激辩,大模型应用最全行业参考在此
在中国AIGC产业峰会的现场,20位大咖展开激辩。从软件应用、智能终端乃至具身智能等,AIGC正在全面席卷,「你好,新应用!」成为本届AIGC峰会主题。
至顶网
业界供稿 2024-04-19 16:56:56
微软研究院重大突破:用5000道逻辑题训练出会推理的AI,解题能力提升125%!
微软研究院开发出Logic-RL训练框架,仅用5000个逻辑谜题就让7B参数AI模型学会深度推理。该方法通过强化学习让AI自发发展出反思、验证等思维能力,在数学竞赛中实现125%性能提升,证明了小规模精准训练的巨大潜力,为AI推理能力发展提供新思路。
至顶网
科技行者 2025-08-22 10:02:00
南洋理工大学团队创新突破:让3D建模像拼图一样简单,多模态数据协同创作高质量3D内容
新加坡南洋理工大学研究团队提出TriMM系统,这是首个融合RGB图像、深度图和点云数据的3D生成模型。通过协同多模态编码技术,系统能够同时利用彩色图像的丰富纹理和几何数据的精确结构信息,仅用4秒即可从单张图片生成高质量3D模型。该技术在多个数据集上的表现超越现有方法,为3D内容创作提供了新的解决方案。
至顶网
科技行者 2025-09-04 09:59:44
伊利诺伊大学团队突破:让AI同时看懂和画出图像,速度提升6倍的革命性架构
伊利诺伊大学研究团队提出LaTtE-Flow架构,创新性地将多模态理解和图像生成统一在单一模型中。通过层级时间步专家和时间步条件残差注意力两大技术突破,实现6倍推理加速和4倍参数效率提升,同时保持高质量的图像生成和理解性能,为高效多模态AI应用奠定基础。
至顶网
科技行者 2025-06-19 10:46:22
IBM研究院带来语音理解新突破:让AI更懂人话的训练秘籍
IBM研究院开发出群体相对策略优化(GRPO)方法来训练语音感知大语言模型,通过让AI生成多个答案并比较优劣进行学习,在语音问答和自动翻译任务上取得显著性能提升。实验显示该方法比传统监督微调效果更好,BLEU分数最高提升10.9%,为语音理解AI的发展开辟了新路径。
至顶网
科技行者 2025-10-15 12:07:04
共谱数据的冰与火之歌:Techo TVP 开发者峰会圆满落幕!
2021年4月24日,由腾讯云 TVP 主办的首届 Techo TVP 开发者峰会「数据的冰与火之歌——从在线数据库技术,到海量数据分析技术」在深圳深铁皇冠假日酒店成功举办。
至顶网
业界供稿 2021-04-29 09:45:13
阿里云如何让“创新扩散”,做中国企业出海的隐形推手?
如今进入全面被AI渗透的时代,AI创新将再次重塑云计算的底层能力,并在全球化进程中与云相互赋能、共同成长,推动中国企业实现全球化布局与技术升级的双向奔赴。
至顶网
高飞 2025-03-11 20:34:02
面向2030影响数据存储产业的十大应用(上):主流应用
本篇先介绍商用阶段的六大主流应用,后面会介绍萌芽期的四个新兴应用。
至顶网
业界供稿 2022-01-04 15:29:16
荣耀会如何改变智能手机的“外在”与“内在”
在这次骁龙峰会期间,赵明接受了科技行者的采访,分享了他更多对于AI大模型、PC市场、生态合作、荣耀发展的思考。
至顶网
周雅 2023-10-26 15:57:18
微软造出AI播音员,单次录制90分钟多人对话!VIBEVOICE如何重新定义语音合成?
微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。该技术采用连续语音编码器实现3200倍压缩率,结合大语言模型和下一令牌扩散技术,支持最多4个说话者的自然对话生成。在多项评测中全面超越现有系统,为播客制作、有声读物等应用开辟新可能。
至顶网
科技行者 2025-09-03 11:38:22
当AI开始懂电影:上海人工智能实验室重新定义机器视觉的电影语言理解
上海人工智能实验室联合多所高校开发出首个AI电影语言理解评测平台ShotBench,发现当前最先进AI模型在专业视觉理解方面存在重大缺陷。团队构建7万样本数据集ShotQA,开发出突破性模型ShotVL,在电影语言理解上创造新纪录,为AI辅助视频制作和创意产业变革奠定基础。
至顶网
科技行者 2025-07-01 15:52:41
想让AI像人一样说话?谷歌DeepMind用魔法般的数据驱动方法让语音合成更自然!
谷歌DeepMind研究团队开发了革命性的语音合成技术,采用数据驱动方法让AI学会像人类一样自然说话。通过观察大量真实语音数据,新系统能够生成更自然、更有情感的语音,在客观测试和主观评价中都显著超越传统方法。这项技术将为智能助手、有声读物、教育软件等领域带来重大改进,同时为语言障碍人群提供帮助,展现了人机交互技术的光明前景。
至顶网
科技行者 2025-06-13 09:43:26
阿里通义实验室推出WebSailor:首个与顶级闭源系统媲美的开源超级网络智能体
阿里通义实验室发布首个媲美顶级闭源系统的开源超级网络智能体WebSailor,突破性解决开源模型在超高不确定性任务中的系统性推理难题,在BrowseComp基准测试准确率提升3倍,标志着开源技术在复杂信息搜索领域的历史性跨越。
至顶网
至顶AI实验室 2025-07-07 16:57:16
<
上一页
222
223
224
225
226
227
228
229
230
231
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号