搜一下
用了 0.116596秒,为您找到
bob
手机
在线
網纸
YB233
相关内容9432 条
让一个视频"换个拍摄角度"——浙江大学团队打造的神奇视频重拍工具ReCamMaster
浙江大学联合快手团队开发的ReCamMaster系统能够根据单个视频重新生成不同摄像机角度的视频,保持动作完美同步。该技术采用创新的帧维度条件注入机制,利用虚幻引擎5构建的13.6万视频训练集,在摄像机精度、时间同步和视觉质量等方面显著超越现有方法,可应用于视频稳定化、超分辨率和外绘制等场景。
至顶网
科技行者 2025-08-04 13:31:04
NVIDIA团队推出SANA-Sprint:让AI画画快如闪电的神奇技术
NVIDIA团队开发的SANA-Sprint技术实现了AI图像生成的重大突破,将传统需要20步的生成过程压缩至1步,在H100上仅需0.1秒即可生成1024×1024高清图像,速度比现有最快模型提升10倍以上。该技术通过创新的混合蒸馏策略,在大幅提升速度的同时保持了图像质量,并支持实时交互应用,为AI绘画从专业工具向大众应用的转变奠定了基础。
至顶网
科技行者 2025-07-30 20:51:00
报告发布丨上国会智能财务研究中心-管理会计研究-元年研究院:《数字智能时代,中国企业财务共享的创新与升级调研报告》
报告认为,近20年来,一批中国企业通过财务共享中心建设,建立健全了财务管理标准,规范了集团企业和分子公司财务管理模式,提高了工作效率,降低了运营成本,逐步形成了符合中国商业环境要求和本土企业管理特色的财务共享管理模式。
至顶网
元年科技 2021-10-28 17:33:27
WAIC 2022大会第2天,你们关心的亮点都在这里
今年大会的主题是“智联世界 元生无界”,旨在充分把握人工智能与元宇宙相融互促的发展趋势,连接汇聚世界人工智能最新观点和成果,传递无界共生的创新理念,展现上海智能时代的美好图景。
至顶网
业界供稿 2022-09-03 19:27:10
阿里达摩院推出VideoLLaMA3:让AI同时"看懂"图像和视频的革命性突破
阿里达摩院发布VideoLLaMA3,这是首个采用"以视觉为中心"设计的多模态AI模型,能够同时理解图像和视频内容。该模型通过四阶段训练和任意分辨率视觉标记化等创新技术,在多项图像和视频理解基准测试中取得突破性成绩,特别是在数学推理方面提升显著。VideoLLaMA3为教育、医疗、内容创作等领域提供了强大的视觉理解能力。
至顶网
科技行者 2025-09-18 11:11:20
听她们说,当女性力量与科技融合就会变得很酷
女性加上科技,大家觉得这样很酷。
至顶网
于佳卉 2023-03-08 14:12:14
AutoMat:清华大学与上海AI实验室联合打造的"智能显微镜"——从电镜图像自动重建晶体结构的革命性工具
清华大学和上海人工智能实验室联合开发的AutoMat是一个突破性工具,能自动将电子显微镜图像转换为精确的晶体结构模型并预测材料性质。系统整合了模式自适应降噪、物理引导模板匹配、对称感知结构重建和机器学习性质预测四大模块,由大语言模型代理协调运行。在自创的STEM2Mat-Bench基准测试中,AutoMat远超现有多模态大语言模型,为桥接显微镜成像与原子模拟提供了自动化解决方案,显著加速了材料科学研究流程。
至顶网
科技行者 2025-05-27 13:26:04
中央政法工作会议:要研究无人驾驶、人工智能、虚拟货币、数据权属等新问题,通过立法规范平台行为、加强新就业群体合法权益保护
这次中央政法工作会议的主要任务是:坚持以习近平新时代中国特色社会主义思想为指导,深入贯彻党的二十大和二十届二中、三中全会精神,深入贯彻习近平总书记对政法工作的重要指示和中央经济工作会议、二十届中央纪委四次全会精神,总结工作,分析形势,研究部署2025年政法工作。
至顶网
清华大学智能法治研究院 2025-01-20 11:04:32
零一万物发布千亿参数模型Yi-Large,李开复呼吁关注TC-PMF,拒绝Ofo式烧钱打法
5月13日,在零一万物成立一周年之际,零一万物CEO李开复博士携带千亿参数Yi-Large闭源模型正式亮相,正式进军全球SOTA顶级大模型之首,在斯坦福最新的AlpacaEval 2.0达到全球大模型Win Rate 第一。除此之外,零一万物将早先发布的Yi-34B、Yi-9B/6B中小尺寸开源模型版本升级为Yi-1.5系列,每个版本达到同尺寸中SOTA性能最佳。
至顶网
业界供稿 2024-05-13 13:36:36
AI如何成为蚊子"神探":孟加拉国大学研究团队打造史上最强蚊子繁殖点监测系统
孟加拉国联合国际大学研究团队开发了VisText-Mosquito多模态数据集,这是首个集成视觉检测和自然语言推理的蚊子繁殖点识别系统。该系统包含1970张标注图像,能够识别五类繁殖容器并进行水面分割,同时提供人类可理解的判断解释。YOLOv9s等模型达到92.9%检测精度,为全球蚊媒疾病防控提供了AI技术支撑。
至顶网
科技行者 2025-06-24 10:16:10
为行业找技术,深入场景创造价值
华为中国政企业务总裁吴辉在会上发表了题为《为行业找技术,深入场景创造价值》的主题演讲,重点分享了华为基于多年的探索和实践总结出的行业数字化转型的方法论和企业转型成功秘诀。
至顶网
李祥敬 2022-11-09 12:25:22
陆军中的AI与自主机器人,是这样的
美国陆军研究实验室机动与机动性事务AI与机器学习应用性能管理负责人John Fossaceca最近在一场AI大会上发表演讲,分享了“AI如何应对各类日常场景?”,同时也介绍了“美国陆军的自主机器人乃至其他机器的未来发展方向”。
至顶网
科技行者 2020-08-03 16:27:34
阿联酋顶尖AI大学打造"万能语音助手":30M参数让任何大模型瞬间开口说话
阿联酋穆罕默德·本·扎耶德人工智能大学研究团队开发出轻量级语音合成系统LLMVoX,仅用3000万参数就能让任何大语言模型获得流式语音输出能力。该系统实现475毫秒超低延迟,词错误率仅3.7%,支持多语言扩展,可与视觉语言模型集成,为AI语音交互提供了"即插即用"的革命性解决方案。
至顶网
科技行者 2025-08-01 10:40:57
英伟达DGX Spark:小巧超算处理大模型的新选择
英伟达推出售价3000-4000美元的DGX Spark,号称"全球最小AI超算"。该设备搭载128GB内存,基于Blackwell架构的GB10芯片,虽然速度不及RTX 5090,但能运行消费级显卡无法处理的大模型。支持2000亿参数模型推理和700亿参数模型微调,在AI开发领域具有独特优势,但软件生态仍需完善。
至顶网
The Register 2025-10-15 10:54:57
让AI小模型也能像大模型一样思考:阿姆斯特丹大学团队发现新的"缓存驾驶"技术
阿姆斯特丹大学研究团队开发出"缓存驾驶"技术,通过修改AI模型的键值缓存而非重新训练,让小型语言模型瞬间获得大模型的推理能力。该技术仅需一次调整就能让模型展现逐步推理行为,计算开销几乎为零,在多个推理基准测试中表现优异,还能实现推理风格迁移。
至顶网
科技行者 2025-07-21 11:37:24
省钱高手的AI秘诀:约翰霍普金斯大学让千元预算生成专业级图像描述
约翰霍普金斯大学团队开发了VLV系统,仅用1000美元成本就能达到GPT-4o级别的AI图像描述效果。该系统巧妙组合现有的视觉编码器、扩散模型和语言模型,通过两阶段训练实现高质量图像描述。测试显示VLV在重建质量和人类评价方面与顶级商业模型相当,同时具备出色的空间理解和创意组合能力,为AI技术普及化提供了新思路。
至顶网
科技行者 2025-07-22 10:21:17
2023CSDI算力+智能:数字时代的进化升级
在未来的产业布局中,云网融合、软硬一体化,硬件智能化、软件的泛化以及数据无处不在,基本是未来的趋势。
至顶网
业界供稿 2023-05-18 21:43:02
华盛顿大学团队推出"AI城市向导":让街景图像开口说话,用双眼带你看遍世界每个角落
华盛顿大学等顶尖机构联合推出地理视觉代理概念,让AI能够分析街景、用户照片等视觉数据,回答"咖啡店门在哪里、是否无障碍"等具体问题。团队开发了三个原型:帮助盲人探索街景的StreetViewAI、为残障人士评估环境的Accessibility Scout,以及个性化骑行路线规划的BikeButler,展现了AI与地理信息结合的巨大潜力。
至顶网
科技行者 2025-08-29 09:30:28
声音能否分辨真假?约翰·霍普金斯大学突破性研究让AI秒识别合成语音
约翰·霍普金斯大学研究团队开发出突破性的少样本学习方法,用于检测AI合成语音。该方法通过自注意力原型网络,仅需10个样本就能快速适应新的语音伪造技术,在日语深度伪造检测中实现32%错误率相对减少。这项技术为应对日益复杂的声音欺诈提供了高效解决方案,有望应用于金融安全、司法取证等领域。
至顶网
科技行者 2025-08-28 11:10:40
“具身智能 产业智变新引擎”2024科技创变者大会成功举行
具身智能作为人工智能领域的一颗璀璨新星,正引领着新一轮的技术革命。
至顶网
至顶网人工智能频道 2024-08-09 18:53:11
<
上一页
456
457
458
459
460
461
462
463
464
465
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号