搜一下
用了 0.049495秒,为您找到
大小
单双
技巧
集锦
罔芷
88pkee
驻测
相关内容3164 条
让人工智能看图更聪明:KAIST团队破解多模态大语言模型视觉理解难题
KAIST研究团队提出VIRAL方法,通过视觉表征对齐技术解决多模态大语言模型视觉理解不精准的问题。该方法让AI模型内部视觉表征与预训练视觉基础模型保持一致,避免训练中视觉细节的丢失,在对象计数、空间推理等视觉任务上取得显著性能提升,为多模态AI的视觉理解能力改进提供了简单有效的解决方案。
至顶网
科技行者 2025-09-24 13:54:36
当AI学会了人类最独特的技能:斯坦福大学揭秘机器如何掌握"看图说话"的艺术
斯坦福大学人工智能实验室团队在2015年发表的突破性研究,首次实现了让计算机像人类一样"看图说话"的能力。他们通过创新的注意力机制,让视觉识别系统和语言生成系统能够智能协作,不仅准确识别图像内容,还能生成自然流畅的文字描述,为视障辅助、内容创作、医疗影像分析等领域开辟了广阔应用前景,标志着人工智能向真正理解视觉世界迈出重要一步。
至顶网
科技行者 2025-07-25 11:44:21
无服务vs容器,2022谁来称霸?
容器与无服务器也在各自的道路上不断发展,二者相互竞争、持续演变出新形态才是我们消费者最乐于看到的未来。
至顶网
至顶网软件与服务频道 2021-12-21 18:15:27
英特尔重磅发布全新数据中心处理器,为数字经济发展增添新动力
今日,以“芯加速 行至远”为主题的第四代英特尔至强新品发布会在北京正大中心盛大举行。
至顶网
业界供稿 2023-01-11 17:56:41
AI模型能否真正理解网络表情包的恶意内容?香港浸会大学团队开发出全新智能检测框架
香港浸会大学等机构联合开发的AdamMeme框架,通过多AI智能体协作,能够动态生成个性化测试样本来评估AI模型理解网络表情包恶意内容的能力。该框架突破了传统静态评估的局限,针对每个模型的弱点进行深度探测,实验显示即使是GPT-4o等顶级模型也存在认知盲点,为AI安全评估提供了新思路。
至顶网
科技行者 2025-07-18 09:38:00
大语言模型智能代理评估大全:全球顶尖研究机构首次绘制AI代理能力地图
这项由希伯来大学、IBM研究院和耶鲁大学联合完成的综合性研究,首次系统梳理了大语言模型智能代理评估领域的完整现状,涵盖基础能力评估、应用场景测试、通用能力考量和开发框架四大维度,为这个快速发展的领域绘制了详细地图,并指出了向现实化、动态化、细粒度评估发展的重要趋势。
至顶网
科技行者 2025-08-04 10:54:26
麻省理工团队揭秘:AI如何仅靠语音就能"读懂"你在什么地方说话
麻省理工学院研究团队开发出革命性AI技术,能够仅通过分析音频信号就准确推断出说话者所处的三维空间环境。该技术利用声音在不同空间中的独特传播特征,让AI系统像声学侦探一样重建完整的空间几何信息。在测试中,系统的空间尺寸预测精度达95%以上,声学特性匹配度超90%。这项创新为智能家居、虚拟现实、音频制作等领域带来广阔应用前景,有望让未来的智能设备真正理解和适应人类的生活环境。
至顶网
科技行者 2025-08-28 14:50:35
让专家"接力"工作,AI模型变得更聪明了——西北大学等顶尖院校联手破解人工智能效率难题
西北大学等顶尖院校联合提出专家链(CoE)架构,通过让AI模型内部专家依次协作而非并行工作,在相同计算预算下将数学推理验证损失从1.20降至1.12,同时减少17.6%-42%内存使用。这种"接力式"处理方式为AI模型扩展提供了新维度,证明了智能协作比简单资源堆砌更有效。
至顶网
科技行者 2025-06-30 10:53:20
AI故事画师的"审查员":弗吉尼亚理工大学让机器学会画出前后一致的连环画
弗吉尼亚理工大学研究团队开发了名为"审查与修复"的AI系统,通过四个专业化AI组件协作,解决了AI绘画中角色外观不一致的问题。该系统能自动检测并修正故事插图中的视觉不一致性,大幅提升了AI生成连续图像的质量和连贯性,为创意产业提供了可靠的智能助手,展现了多AI协作解决复杂问题的新范式。
至顶网
科技行者 2025-06-27 09:34:21
企业可持续发展“知行”难“合一”?IBM提出新解法
IBM长期致力于打造一个更加可持续、更公平的未来。
至顶网
业界供稿 2022-05-19 13:32:29
西门子CEO Roland Busch访谈:全力投身数字孪生浪潮
如何在工业元宇宙中运用数字孪生技术?
至顶网
至顶网软件与服务频道 2024-02-19 10:33:35
狂奔的“新造车运动”与“智能制造”的进阶路
当大家都在喊转型的时候,有可能才是最不应该被带节奏的时候。
至顶网
周雅 2021-09-13 12:03:14
“拜登政府”如何影响全球科技业?
科技公司是人类历史以来最不喜欢监管,最不喜欢边界的商业团体。
至顶网
高飞 奇客故事(cybergushi) 2020-11-13 18:26:01
当AI学会"读心术":MIT团队让机器人真正理解人类意图的突破性研究
MIT研究团队开发出突破性技术,让机器人能够同时理解多种类型的人类反馈,真正掌握人类的深层意图和偏好。这项技术通过融合偏好比较、演示学习等多种反馈方式,使机器人在任务成功率和用户满意度上分别提升30%和40%,为未来人机协作开辟了新的可能性。
至顶网
科技行者 2025-07-24 10:44:46
西门子CEO Roland Busch:全力投身数字孪生浪潮
西门子公司CEO Roand Busch曾在CES 2024大会上发表主题演讲,探讨如何在工业元宇宙中运用数字孪生技术、生成式AI又将给西门子带来怎样的深远影响。
至顶网
至顶网软件与服务频道 2024-02-18 10:40:19
REDMI Note 15 Pro+发布,同档最抗摔的实战之王,首销 1899元起
耐用品质实战之王,真抗摔真防水。
至顶网
业界供稿 2025-08-21 22:22:09
AUTOMIND:清华浙大联手打造的"数据科学全自动大师",让AI学会像专家一样解决机器学习难题
这项由浙江大学与蚂蚁集团联合研究的AUTOMIND系统,通过构建专家知识库、智能搜索策略和自适应编程三大创新,让AI具备了接近人类专家的数据科学能力。在权威测试中超越56.8%的人类参赛者,相比前代系统效率提升300%,成本降低63%,为数据科学自动化开辟了新路径。
至顶网
科技行者 2025-07-07 17:29:28
机器人终于会"看、想、做"了!AgiBot团队打造史上首个视频驱动的机器人操作统一平台
AgiBot团队联合新加坡国立大学等机构开发出Genie Envisioner机器人操作统一平台,首次将视频生成技术应用于机器人控制。该系统通过100万个操作视频学习,让机器人能够预测行动结果并制定策略,在多个复杂任务上表现优异,仅需1小时数据即可适应新平台,为通用机器人智能开辟全新路径。
至顶网
科技行者 2025-08-12 14:18:42
字节跳动推出X-Streamer:让静态照片变身会聊天的数字人,实现无限时长实时对话
字节跳动研究团队推出X-Streamer技术,首次实现从单张照片生成具有无限对话能力的数字人。该系统采用思考者-行动者双架构,统一处理文本、语音和视频生成,支持实时交互和长时间稳定对话。在双GPU配置下可达25fps生成速度,在多项指标上超越现有方法,为数字人技术的实际应用奠定了基础。
至顶网
科技行者 2025-10-17 14:07:55
芯片设计的新武器:阿里云如何让AI帮工程师走出设计迷宫
阿里云智能集团研究团队在《VLSI设计期刊》发表突破性研究,提出基于图神经网络的芯片布局优化框架。该技术将复杂芯片设计转化为图形网络问题,通过AI系统自动寻找最优布局方案。实验显示相比传统方法,功耗降低15-18%,设计效率显著提升,已在智能手机和服务器芯片项目中成功应用。
至顶网
科技行者 2025-08-21 16:41:22
<
上一页
140
141
142
143
144
145
146
147
148
149
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号