搜一下
用了 0.213118秒,为您找到
彩神
v
怎么
分析
網纸
YB233
相关内容16932 条
清华大学与快手联合推出
V
ideoReward:让AI视频生成更懂人心的突破性方法
这项由清华大学与快手科技等机构合作的研究构建了包含18.2万个人工标注样本的大规模视频偏好数据集,开发了
V
ideoReward多维度视频评价系统,并提出了Flow-DPO等三种对齐算法,成功让AI视频生成模型学会按照人类偏好创作内容,显著提升了生成视频的质量和用户满意度。
至顶网
科技行者 2025-09-17 10:30:00
九大维度解析UPS使用故障与板级器件故障
所谓使用性故障,是指由于操作、维护人员的误操作、对故障现象的错误判断、所采取的不当措施及经验性诊断等造成的故障。UPS的使用性故障大致可以分为知识性故障、操作性故障、延误性故障、维护性故障、经验性故障、环境性故障、突然掉电故障、UPS器件或板级故障等。
至顶网
数据中心基础设施运营管理 2024-10-15 11:04:42
中科院发布Stream-Omni:AI同时"看懂""听懂""说话"的全能聊天助手诞生了
中科院团队开发的Stream-Omni是一个突破性的多模态AI模型,能同时处理文字、图像和语音,实现真正的"看听说"一体化交互。该模型创新性地采用了针对性的模态对齐策略,仅用2.3万小时语音数据就达到优秀性能,并能在交互中实时显示中间结果,为AI助手的自然化交流开辟了新路径。
至顶网
科技行者 2025-06-23 11:44:53
“让天下没有难做的AI应用”,阿里云的底气在哪?
将所有“传统应用”再做一遍,才是AI真正的价值所在。
至顶网
于佳卉 2024-09-23 12:25:11
浙大团队开创GUI智能助手新方法:让AI精准识别屏幕元素如探案高手
浙江大学联合多家机构提出AEPO方法,通过多答案生成和自适应探索奖励机制,显著提升AI在图形界面中的元素识别准确性。该技术让AI能同时考虑多个候选答案并科学评估,解决了传统方法容易陷入错误自信的问题,在五个基准测试中均达到业界领先水平,为智能GUI助手的实际应用奠定了重要基础。
至顶网
科技行者 2025-08-13 10:57:20
ICME 2021 | 高性能、保护隐私的下一代生物识别之路
墨奇科技 CEO 及联合创始人邰骋、墨奇科技 CTO 及联合创始人汤林鹏,介绍了如何将指纹识别问题转化为高精度图像搜索问题,基于先进的多尺度特征表示、极少样本的自学习框架、超高性能的异构搜索系统,首次实现了无需细节特征的指纹比对系统。
至顶网
科技行者 2021-07-22 23:22:48
智算“破壁者”:华为穿越AI生态周期的两张“底牌”
在算力“狂飙突进”的表象之下,华为正试图用“鲲鹏”与“昇腾”两张“底牌”,给出新的解题思路。
至顶网
毛烁 2025-05-26 17:43:59
微软亚洲研究院新发现:计算机也能像人类一样从说话声音中"听出"面部表情
微软亚洲研究院开发的A
V
-DiT系统实现了音视频联合生成的重大突破,能够像人类一样理解声音与面部表情的对应关系。该系统采用扩散变换器架构,通过创新的注意力机制和分层处理策略,实现了高质量的音视频同步生成。实验显示其生成内容接近真实水平,在视频会议、内容创作、教育等领域具有广阔应用前景,代表了多媒体理解技术的重要进展。
至顶网
科技行者 2025-09-29 14:29:44
在消灭宫颈癌这件事情上,腾讯天衍实验室用AI做了重磅的研究
宫颈癌是目前唯一病因明确、唯一可以早期预防和治疗、唯一可能基本消灭的癌症。
至顶网
业界供稿 2021-06-09 08:27:10
智算“破壁者”:华为穿越AI生态周期的两张“底牌”
在算力“狂飙突进”的表象之下,华为正试图用“鲲鹏”与“昇腾”两张“底牌”,给出新的解题思路。
至顶网
毛烁 2025-05-27 15:08:49
DriftMoE:让机器学习像换挡一样智能,都柏林大学带来数据流概念漂移的专家混合新方案
这项由都柏林大学团队完成的研究提出了DriftMoE系统,通过神经网络路由器与增量专家的协同学习来处理数据流中的概念漂移问题。该方法在九个基准数据集上的表现与传统大型集成方法相当,但资源消耗显著更低,特别适合边缘计算等资源受限场景,为构建高效自适应的流数据学习系统提供了新思路。
至顶网
科技行者 2025-07-29 17:14:26
打造企业数字化转型的网络基石 从华为AirEngine新品看Wi-Fi 6产业新高度
2020年3月5日,“Wi-Fi 6改变企业,华为AirEngine Wi-Fi 6新品解读会”线上举行。华为邀请各界专家、行业客户及伙伴,一起分享了Wi-Fi 6对企业数字化转型的影响,以及华为AirEngine Wi-Fi 6新品亮点。
至顶网
李祥敬 2020-03-12 13:42:20
阿里巴巴首创医学影像"万能翻译机":一个模型搞定X光、CT、内镜所有影像检索
阿里巴巴达摩院联合多所知名高校开发出M3Ret医学影像检索系统,首次实现单一模型处理X光、CT、超声、内镜等多种影像类型。该系统通过86万张真实医院影像进行自监督训练,在多项检索任务中超越现有方法,甚至能在未见过MRI数据情况下准确检索MRI影像,为医学AI的统一化发展开辟新路径。
至顶网
科技行者 2025-09-19 11:07:17
赋能数字经济高质量发展 产学研深化合作共建信任互联新篇章
近日,以“见证信任的力量”为主题2021年信任互联大会举行。大会聚焦网络信任领域,邀请了相关领导、知名学者、行业专家、合作伙伴、媒体等嘉宾齐聚一堂,深入探讨了新型网络信任体系的新内涵,以及对推动经济社会发展的重要价值。
至顶网
李祥敬 2021-04-29 10:37:52
疫情新常态下,机器人与自动化技术如何创造新岗位?
自动化会给工作岗位造成怎样的影响?
至顶网
科技行者 2020-09-14 11:45:39
ByteDance发布Seaweed-7B:用更少资源训练出媲美大模型的视频生成AI
ByteDance Seed团队发布的Seaweed-7B研究展示了如何用相对较少的计算资源(665,000 H100 GPU小时)训练出高质量视频生成模型。这个70亿参数的模型通过精细的数据处理、创新的
V
AE压缩技术、混合流架构和多阶段训练策略,在图像转视频任务中排名第二,在多项评估中超越了参数量更大的竞争对手,同时推理速度快62倍,证明了中等规模模型的巨大潜力。
至顶网
科技行者 2025-07-17 09:27:17
白川团队推出Baichuan-M2:让AI医生像真正的医生一样思考和对话,在全球最严格医疗测试中击败所有开源模型
百川智能团队开发的Baichuan-M2是一个32B参数的医疗AI模型,通过创新的动态验证系统突破了传统静态评估局限。该系统包含虚拟患者模拟器和临床评估标准生成器,让AI在真实诊疗环境中学习。在HealthBench测试中,Baichuan-M2获得60.1分超越所有开源模型,在最困难的HealthBench Hard中获得34.7分,成为全球仅有两个突破32分的模型之一。
至顶网
科技行者 2025-09-23 13:36:38
四步搞定图像编辑:清华和AIRI的循环一致性模型让修图变得又快又好
清华和AIRI研究团队提出循环一致性图像编辑方法,仅需4步即可实现高质量图像编辑,速度比传统方法快10倍。该方法通过训练AI反复练习"看图-重画"过程提升图像理解能力,结合智能引导机制确保编辑质量,在多项评测中超越现有快速方法,为AI图像编辑的普及应用奠定基础。
至顶网
科技行者 2025-06-30 11:21:52
1比特革命:微软发布首个开源原生1比特大语言模型 BitNet b1.58 2B4T
微软研究院的研究团队近日发布了一项突破性成果——BitNet b1.58 2B4T,这是首个开源的、原生1比特大语言模型(LLM)。
至顶网
科技行者 2025-04-18 16:37:56
阿里Qwen团队重磅发布:一个AI助手同时懂看听说,还能实时"思考+说话"
阿里Qwen团队发布了突破性多模态AI模型Qwen2.5-Omni,能同时理解文字、图片、音频和视频输入,并实时生成文字和语音回应。该模型采用创新的TMRoPE时间对齐技术和Thinker-Talker架构,实现了真正的流式多模态交互,在多项基准测试中达到最先进性能。
至顶网
科技行者 2025-08-04 13:32:16
<
上一页
827
828
829
830
831
832
833
834
835
836
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号