搜一下
用了 0.049951秒,为您找到
北京
pk
精准
人工
计划
软件
網纸
YB233
相关内容3540 条
让机器听懂"你说我说":布尔诺理工大学如何破解多人对话识别难题
布尔诺理工大学研究团队开发了DiCoW和DiariZen两个系统,用于解决多人对话中的语音识别难题。该系统巧妙结合说话人分离与语音识别技术,在国际挑战赛中获得第二名,能处理15种语言的对话场景。研究发现系统具备良好的跨语言泛化能力,即使主要用英语训练也能处理其他语言。团队已开源相关模型,为会议记录、多语言交流等实际应用提供了强大工具。
至顶网
科技行者 2025-06-25 09:35:58
痛击马斯克:Meta打造Threads的幕后故事
一家身陷危机的公司返璞归真,并迅速掀起病毒式传播。但如此赤裸裸地复制Twitter,能否为这家老迈的科技巨头注入新的活力?
至顶网
The Washington Post 2023-08-02 11:10:15
香港科技大学团队突破:让AI像真正的设计师一样,一步步"拼积木"创造3D世界
香港科技大学团队开发了名为CoPart的革命性3D生成技术,它模仿人类设计师的工作方式,将复杂3D物体分解为多个部件分别生成再组装。该技术采用双重编码策略和相互指导机制,确保各部件既精细独立又协调统一。研究团队还构建了包含91000个部件的大规模数据集PartVerse。实验显示CoPart在生成质量上显著优于传统方法,并支持部件编辑、关节物体生成等多种应用,为3D内容创作开辟了新方向。
至顶网
科技行者 2025-07-21 11:30:41
到底“谁”最需要无人驾驶汽车?
想要开发出几乎能够适应一切道路状况的无人驾驶汽车,无疑是项极度严苛的挑战。
至顶网
科技行者 2020-05-19 18:18:09
上海交大和复旦大学揭秘:AI视觉模型的"视觉陷阱"——当智能助手被恶意操控时会发生什么?
上海交大和复旦大学研究团队发现了AI视觉系统的重大安全漏洞——IAG攻击。这种攻击能让AI助手在视觉定位时被恶意操控,无论用户询问什么,都会指向攻击者预设的错误目标,且几乎无法被察觉。实验显示攻击成功率超65%,现有防御技术完全失效,对机器人、自动驾驶等应用构成严重威胁。
至顶网
科技行者 2025-08-18 10:18:19
北大团队揭秘:如何让3D渲染技术从"手工作坊"升级为"智能工厂"
北京
航空航天大学等机构联合提出NeRF-GS框架,将神经辐射场NeRF与3D高斯点云3DGS进行协同优化。该方法通过特征共享、残差向量建模和联合优化三大机制,有效解决了3DGS对初始化敏感、空间感知有限等问题,在保持实时渲染的同时显著提升了图像质量,为3D场景表示技术融合提供了新思路。
至顶网
科技行者 2025-08-06 11:09:36
人工
智能专家团队首次让AI"专家"自己选择任务:中美研究团队颠覆混合专家模型传统设计
中美研究团队提出专家自主选择的AI新架构,让AI专家根据内在激活强度自主选择处理任务,避免传统路由器分配的不匹配问题。在40亿参数模型验证中,新方法在多项任务上超越传统混合专家模型,实现更均衡的负载分配和更高的处理效率,为大规模AI系统的专业化分工提供了创新解决方案。
至顶网
科技行者 2025-09-16 11:08:56
中科大团队挑战AI视觉:让AI真正"看懂"世界,不只是回答问题
研究团队开发了IR3D-Bench基准测试,要求AI根据单张图片重建完整3D场景,以此检验AI是否真正理解所见世界。测试涵盖20多个顶尖AI模型,结果显示虽然AI在物体识别上表现出色,但在空间关系理解和尺寸估计方面存在明显不足。研究为评估AI视觉理解能力提供了新标准。
至顶网
科技行者 2025-07-03 16:24:32
西湖大学重磅突破:只用文字就能训练AI看图,成本降低96%的神奇技术
西湖大学研究团队开发了Unicorn技术,首次实现仅用文字训练视觉语言AI模型,无需任何真实图片。该方法通过三阶段数据合成流程,将文字描述转换为合成图像表征,训练的Unicorn-8B模型在多项测试中表现优异。相比传统方法,成本降低96%、时间缩短73%,为AI训练提供了高效经济的新路径。
至顶网
科技行者 2025-07-14 09:50:43
机器人学会"技能混搭":斯坦福等顶尖高校让人形机器人变身全能助手
本研究由斯坦福大学等顶尖学府联合提出SkillBlender方法,让人形机器人像人类学习技能一样先掌握基础技能,再智能混合应对复杂任务。通过预训练行走、伸手、蹲起、踏步四种原始技能,系统能以最少的奖励设计完成复杂全身协调任务。新建的SkillBench测试平台包含三种机器人、八项任务,并创新性地评估动作准确性和自然度。
至顶网
科技行者 2025-06-19 12:53:19
从电驱到智能座舱全面覆盖,小米汽车五大自研核心技术正式披露
刷新行业性能天花板,小米“人车家全生态”五大核心技术,小米 SU7新车亮相。
至顶网
业界供稿 2023-12-28 18:24:42
多模态大模型也会"不懂装懂"?港浸大团队揭秘AI如何学会说"我不知道"
香港浸会大学团队开发了HumbleBench,这是目前最大的AI幻觉评估基准,包含22,831个测试题,专门评估多模态大语言模型的"认知谦逊"能力。与传统只测试选择正确答案的基准不同,HumbleBench的每个问题都包含"以上都不对"选项,测试AI能否在不确定时诚实承认无知。研究发现即使最先进的AI模型表现也不理想,最好的模型准确率仅73%,在极端测试中甚至接近0%,揭示了当前AI系统"不懂装懂"的严重问题。
至顶网
科技行者 2025-09-26 13:56:34
伊利诺伊大学团队打造"智能图书管理员":让学术论文自动分类不再是梦
伊利诺伊大学团队开发的TaxoAdapt框架革新了学术论文自动分类技术,通过多维度分析和自适应扩展机制,能够动态构建反映学术演进趋势的分类体系。该系统在多项指标上显著优于现有方法,成功捕捉了从BERT时代到指令调优时代的学术转变,为学术文献组织和知识发现提供了智能化解决方案。
至顶网
科技行者 2025-06-18 11:12:46
七个2020年服务器的发展趋势
作为服务器行业的全球优秀者,戴尔易安信汇聚了全球服务器研发领域优秀的人才,他们对服务器行业的观察和思考,可以说是未来服务器发展的重要风向标。
至顶网
戴尔 2020-02-18 16:49:24
InternVL3.5:上海AI实验室的多模态AI新突破,让机器像人一样理解图文世界
上海AI实验室发布的InternVL3.5是新一代开源多模态大语言模型,能够同时理解图像和文字内容。该系统采用级联强化学习技术,推理性能提升16%,并通过视觉分辨率路由器实现4倍推理加速。在36项基准测试中表现优异,最大模型在多学科推理任务中得分77.7,接近商业模型水平,支持GUI交互、多语言处理等功能。
至顶网
科技行者 2025-09-01 15:53:20
卡内基梅隆大学研究团队突破性解决AI推理效率难题:让机器像侦探一样聪明破案
卡内基梅隆大学研究团队提出MRT方法,通过元强化学习优化AI推理过程。该方法不仅关注最终答案正确性,还奖励思考过程中的有效进展,解决了现有AI"思考时间长但效率低"的问题。实验显示MRT在数学推理任务中准确率提升2-3倍,计算效率提升1.5-5倍,为构建更智能高效的AI系统提供了新路径。
至顶网
科技行者 2025-07-31 11:25:45
惠普商用终端全面更新:推出新款EliteBook、战系列、ZBook等系列新品
更高效、更安全、更灵活的AI PC产品组合及创新解决方案,深化人与工作、员工与企业的关系。
至顶网
刘文轩 2024-05-11 10:26:07
让AI炒股变得更聪明:哈佛大学等团队发明的"智能交易员"如何用对话模式赚钱
这是一项融合大语言模型与强化学习的金融交易AI创新研究。哈佛等知名院校团队开发的FLAG-TRADER系统让仅1.35亿参数的小型AI模型在股票和加密货币交易中超越了GPT-4等大型商业模型。该系统通过部分微调和夏普比率奖励机制,实现了既能理解复杂市场信息又能从交易实践中持续学习的智能交易决策,为AI在金融领域的应用开辟了新路径。
至顶网
科技行者 2025-08-20 18:05:38
土耳其AI如何识破聊天机器人的"胡说八道"?伊斯坦布尔Newmind AI团队首创检测系统
土耳其伊斯坦布尔Newmind AI团队开发出首个专门针对土耳其语的AI幻觉检测系统Turk-LettuceDetect,能够逐字识别AI生成内容中的虚假信息。该系统使用三种不同的AI模型,在包含17790个样本的数据集上训练,最佳模型达到72.66%的检测准确率。这项研究填补了土耳其语AI安全检测的空白,为8000万土耳其语使用者提供了更可靠的AI交互体验。
至顶网
科技行者 2025-10-09 10:21:31
清华大学团队揭秘AI视觉识别“轻装上阵"的秘密:无需真实数据也能让神经网络变聪明
清华大学团队突破性开发"零样本量化"技术,让AI模型在不接触真实数据的情况下完成高效压缩,性能反超传统方法1.7%,为隐私保护时代的AI部署开辟新路径。
至顶网
至顶AI实验室 2025-07-24 17:07:16
<
上一页
155
156
157
158
159
160
161
162
163
164
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号