搜一下
用了 0.130259秒,为您找到
大发
玩和值
稳定
中方
法规
罔芷
88pkee
驻测
相关内容7975 条
作为“水货”开发,我如何从月薪一千五“混”到两万
如果真把小韩当成“水货”,那可大错特错了。
至顶网
至顶网码客人生频道 2023-03-29 16:24:32
OpenStack基金会 ( OSF)演进为开源基础设施基金会(Open Infrastructure Foundation,OIF)
OpenStack基金会(OSF)正式演进为开源基础设施基金会(Open Infrastructure Foundation, OIF),开源社区将持续开发优秀的基础设施软件,满足实际生产应用中的各类需求。
至顶网
业界供稿 2020-10-20 10:56:08
GRE套装:提升视觉语言模型地理定位能力的全新方案 - 精细调优与强化推理链打造超强视觉地理识别能力
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。
至顶网
科技行者 2025-06-02 12:20:34
哥伦比亚大学发布革命性AI检索技术:用"异构图"重新定义智能问答系统
哥伦比亚大学研究团队发布NodeRAG技术,通过异构图结构革新智能问答系统。该方法将文档信息分解为7种节点类型,采用双重搜索机制,在多个权威测试中准确率达89.5%,检索效率提升50%以上,为智能信息检索技术带来重大突破。
至顶网
科技行者 2025-07-14 14:39:22
VITA-1.5:让计算机像人一样同时"看"和"说话"的革命性突破
VITA-1.5是首个实现GPT-4o级别实时视觉语音交互的开源多模态大语言模型。通过创新的三阶段训练策略,系统能够同时处理图像、视频和语音信息,实现端到端的语音对话,无需外部ASR或TTS模块。在多项基准测试中表现优异,语音识别准确率达到97.8%以上,为多模态人机交互开辟了新的可能性。
至顶网
科技行者 2025-09-16 13:03:42
机器人学会3D"变身术":南华理工大学让机器人像人类一样理解物体运动
南华理工大学等机构提出3DFlowAction方法,让机器人通过预测物体3D运动轨迹来学习操作技能。该研究创建了包含11万个实例的ManiFlow-110k数据集,构建了能预测三维光流的世界模型,实现了跨机器人平台的技能迁移。在四个复杂操作任务上成功率达70%,无需特定硬件训练即可在不同机器人上部署,为通用机器人操作技术发展开辟新路径。
至顶网
科技行者 2025-06-10 14:21:54
谷歌CEO皮查伊两小时访谈:AI是人类所见过最深远的技术,意义将超越火与电,因为它可以自我迭代
谷歌CEO皮查伊在AI竞赛低谷期坚持"信号降噪"原则,顶住压力加倍投入,最终带领谷歌凭借Gemini系列重夺领先。他坚信AI将超越火与电的革命性影响,通过递归自我改进极大降低创意实现门槛,这场"创造力民主化"浪潮或将解锁80亿人的认知潜能。
至顶网
至顶AI实验室 2025-06-09 16:34:01
G1项目:Moonshot AI通过强化学习提升视觉语言模型的感知与推理能力
这篇研究介绍了Moonshot AI团队开发的G1模型,该模型通过强化学习显著提升了视觉语言模型在游戏环境中的决策能力。研究团队首创了VLM-Gym训练环境,包含多种视觉游戏与统一接口,并开发了两代模型:G0通过纯强化学习实现自我进化,G1则结合感知增强冷启动与强化学习,在所有游戏中超越教师模型。最关键的发现是感知和推理能力在学习过程中相互促进,为解决视觉语言模型的"知道-行动"差距提供了新方向。
至顶网
科技行者 2025-05-29 13:18:22
可实时交互的AI生成世界,腾讯发布的AI框架Yan,会是元宇宙的破局者吗?
可实时交互的AI生成世界,腾讯发布的AI框架Yan,会是元宇宙的破局者吗?
至顶网
至顶AI实验室 2025-08-18 16:12:10
双向语言模型是更好的知识记忆者?WikiDYK成为大语言模型知识注入的全新标准
这项研究介绍了WikiDYK基准测试,利用维基百科"你知道吗"板块的实时更新内容评估大语言模型的知识注入能力。研究发现,双向语言模型(BiLMs)在记忆知识方面显著优于因果语言模型(CLMs),准确率高出约23%。基于此,研究团队提出了一个模块化框架,将BiLMs作为知识库集成到LLMs中,进一步提升了29.1%的可靠性。这一发现挑战了当前主流LLM架构的优势假设,为AI系统的知识更新提供了新方向。
至顶网
科技行者 2025-05-23 15:32:10
Yandex研究院重磅突破:让AI画画变快10倍的"分辨率阶梯"技术
Yandex研究院开发出SWD技术,通过"阶梯式"分辨率策略让AI绘画速度提升2-10倍。该方法从低分辨率开始逐步升级,避免在早期高噪声阶段处理无效细节,同时创新了分片分布匹配技术确保质量。在多个主流模型上的测试显示,SWD在保持相近质量的同时显著提升了生成效率,为AI内容创作的实时化应用奠定了基础。
至顶网
科技行者 2025-07-31 09:55:57
2022企业数字化转型十大趋势
事前没有人能预测到,企业数字化转型的进程会在过去两年突然改变。每个行业、每个领域的转型都在加速,并且不断扩大规模。
至顶网
元年研究院 2022-02-15 15:43:37
百炼成金 向AI炼成金融能力
阿里云演示了如何借助“通义点金”智能平台的银行业工作流中,实现多智能体协同驱动的、全自动化生成信贷尽调报告。
至顶网
毛烁 2025-08-25 16:51:39
当机器开始"看懂"人类情感:清华大学团队让AI学会识别表情背后的真实感受
清华大学研究团队在IEEE Transactions on Affective Computing发表突破性研究,提出双重学习策略让AI准确识别人类面部情感。新方法结合判别性和生成性学习,在多个标准数据集上准确率显著提升3-4个百分点,特别在处理陌生人脸时表现出色。技术有望应用于智能教育、医疗健康、人机交互等领域,但仍需解决文化差异和隐私保护等挑战。
至顶网
科技行者 2025-07-22 09:50:58
AI大模型能否真正理解物理世界?多所顶尖高校联手测试结果令人深思
这项研究开发了首个轻量级物理推理评估框架,测试四种主流视觉语言模型在抛射运动、碰撞动力学、力学和流体动力学四个领域的表现。结果显示中等规模的Qwen2.5-VL-7B意外击败最大模型获得最高分0.815,揭示了当前AI模型更擅长公式应用而非真正物理理解的局限性。研究为科学推理评估提供了可复制的工具,并指出概念性错误是主要问题,为未来AI发展指明方向。
至顶网
科技行者 2025-09-28 13:47:25
Alexa+预览:一场近乎哲学的体验测试
亚马逊Alexa+预览版正缓慢向用户开放,这款升级版语音助手采用生成式AI重新构建,具备更自然的对话能力和情感智能。经过数周测试发现,Alexa+在处理复杂任务和记忆对话方面有所改进,能够集成Uber、Spotify等第三方服务。然而,其表现不够
稳定
,存在记忆不准确、回复冗长、功能执行不完整等问题,体现了当前AI工具期望与现实之间的差距。
至顶网
engadget 2025-07-28 09:15:12
人工智能学会自己分解组装3D物体:香港大学团队让计算机具备"零件思维"
香港大学团队开发的OmniPart系统实现了AI领域的重要突破,让计算机首次具备了像人类一样的"零件思维"。该系统能从单张2D图片生成具有清晰零件结构的3D模型,用户可通过简单的颜色遮罩控制分解过程。系统采用两阶段设计:先进行结构规划预测零件位置,再同步生成所有零件。实验显示其性能显著优于现有方法,生成效率提升20倍,为3D内容创作、游戏开发、虚拟现实等领域开辟了新的可能性。
至顶网
科技行者 2025-07-17 13:57:26
17个服务器发展趋势,我们都给您总结好了!
长期以来,戴尔易安信一直对行业保有敏锐的洞察和分析力,今天编就来聊聊未来服务器市场的一些洞察。
至顶网
戴尔易安信 2018-09-03 10:13:46
连接:始于科技,成于信任I 腾讯产业互联网笔记(二)
“马化腾法则”的核心是服务分层,即基础业务和增值业务的分层。
至顶网
业界供稿 2021-04-30 17:56:35
当AI看视频也会"产生幻觉":中科院团队首次揭示大模型视频理解的"认知盲区"
中科院团队首次系统研究了大型多模态AI模型在视频理解中的"幻觉"问题,构建了包含6497个问题的HAVEN评估体系,发现AI看视频时会出现物体、场景、事件三类错误。研究还提出了创新的"视频思维模型"解决方案,通过让AI进行step-by-step推理,将准确率提升7.65%,偏差降低4.5%,为提升AI视频理解的可靠性提供了重要突破。
至顶网
科技行者 2025-07-30 09:48:44
<
上一页
373
374
375
376
377
378
379
380
381
382
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号