搜一下
用了 0.053038秒,为您找到
大发
大小
单双
有人
带么罔芷
88pkee
驻测
相关内容3961 条
快手团队打造MIDAS:让AI数字人能像真人一样实时对话互动
快手团队联合清华、浙大推出MIDAS数字人系统,通过创新的自回归视频生成框架实现多模态实时交互。系统采用深度压缩自编码器将视频压缩64倍,结合大语言模型处理音频、姿态、文本等多种输入,配合轻量级扩散头生成高质量视频。可支持双人对话、跨语言合成等应用,生成视频长达4分钟无明显质量下降,为数字人实时交互应用奠定重要技术基础。
至顶网
科技行者 2025-09-04 09:56:55
滑铁卢大学研究团队突破性发明:让AI像真正的学者一样写论文和找文献
滑铁卢大学研究团队开发出ScholarCopilot,一个革命性的AI学术写作助手。该系统突破传统"先检索后生成"模式,实现写作过程中的动态文献检索和精确引用。基于50万篇arXiv论文训练,引用准确率达40.1%,大幅超越现有方法。在人类专家评估中,引用质量获100%好评,整体表现优于ChatGPT。这项创新为AI辅助学术写作开辟新道路。
至顶网
科技行者 2025-07-14 14:39:45
艾诚对话黄渊普:大多数公司倒闭,是因为没有做好最基础的事情
黄渊普表示:亿欧的初心是通过商业的方式让科技更加普及。定位在产业创新服务平台,希望亿欧是一家未来具有全球影响力的国际化公司。
至顶网
业界供稿 2018-12-07 11:13:20
用神经网络重新定义操作系统:滑铁卢大学的NeuralOS让计算机界面完全由AI生成
滑铁卢大学研究团队开发出世界首个完全由神经网络生成的操作系统界面NeuralOS,能够根据用户输入实时生成屏幕画面,鼠标定位精度达1.6像素误差,状态转换预测准确率37.7%。虽然目前存在分辨率和速度限制,但开创了生成式操作系统的先河,预示着未来计算界面可能完全由AI实时创造,实现极度个性化的用户体验。
至顶网
科技行者 2025-07-21 11:33:16
让AI不再唠叨:Rice大学研究团队揭秘如何让聊天机器人言简意赅
Rice大学研究团队发布的这篇综述论文系统分析了大型语言模型推理效率问题。研究发现AI在回答简单问题时经常"过度思考",生成冗长推理过程,增加成本和延迟。论文将解决方案分为三类:优化训练方法、动态调整推理过程、改进用户提示词,为开发更高效的AI推理系统提供了全面指导。
至顶网
科技行者 2025-08-01 14:44:02
AI变身魔法师:伊利诺伊大学团队让你穿上任何衣服,跳出任何舞步
伊利诺伊大学研究团队开发出Dress&Dance系统,这是首个能生成高清虚拟试衣视频的AI技术。用户只需提供个人照片、服装图片和参考动作视频,即可生成1152×720分辨率、24帧每秒的5秒试衣视频。该系统通过CondNet技术统一处理多模态信息,采用分阶段训练策略,支持单件及多件服装同时试穿,在服装细节保真度和动作自然度方面显著优于现有商业产品。
至顶网
科技行者 2025-09-04 14:31:02
打造你自己的拒社交写作设备:使用 DOS 和 2 美元 USB 密钥
本文介绍如何通过 USB 启动 DOS,打造一台独立无干扰的写作系统,详细讲述了技术步骤以及使用经典 DOS 软件的优缺点。
至顶网
The Register 2025-04-28 11:13:44
总编对话丨世纪互联蓝云CEO刘启航眼中的云计算
近日,中国电子报总编辑胡春民与刘启航就云计算产业发展展开了深度对话。
至顶网
业界供稿 2020-07-22 14:51:21
觉醒!一个程序员的自我救赎
历经生命中的高光与低谷,郭正扬心态发生了巨变。
至顶网
尼酱 2022-07-26 11:22:19
腾讯混元:AI也能成为3D"解构大师",一个模型让3D物体智能分解成有意义的零件
腾讯混元团队开发的X-Part技术实现了高质量的3D物体智能分解,能够将复杂3D模型分解成语义清晰、几何完整的零件。该技术通过边界框指导、语义特征注入和同步多部件生成,在几何精度和语义一致性方面显著超越现有方法,为3D打印、游戏开发、工业设计等领域提供了强大的工具支持。
至顶网
科技行者 2025-09-26 12:13:22
华中科技大学最新突破:AI修图神器PixelHacker让图像修复像魔法一样完美
华中科技大学开发的PixelHacker是一款革命性AI图像修复系统,通过创新的"潜在类别指导"方法,只需区分前景和背景两大类别,就能实现近乎完美的图像修复效果。该系统在1400万张图像上训练,采用门控线性注意力机制,在多个国际标准数据集上全面超越现有方法,修复效果自然到几乎看不出痕迹,为个人用户和专业领域提供了强大的图像处理能力。
至顶网
科技行者 2025-07-10 15:41:38
让人工智能看图更聪明:KAIST团队破解多模态大语言模型视觉理解难题
KAIST研究团队提出VIRAL方法,通过视觉表征对齐技术解决多模态大语言模型视觉理解不精准的问题。该方法让AI模型内部视觉表征与预训练视觉基础模型保持一致,避免训练中视觉细节的丢失,在对象计数、空间推理等视觉任务上取得显著性能提升,为多模态AI的视觉理解能力改进提供了简单有效的解决方案。
至顶网
科技行者 2025-09-24 13:54:36
骁龙圈粉,高通扩圈
扩圈,某种程度上正是高通的骁龙平台自2007年面世以来的真实成长写照,也是科技行者远赴夏威夷茂宜岛参与今年骁龙峰会感触最深的印象之一。
至顶网
周雅 2023-10-31 18:54:08
英特尔重磅发布全新数据中心处理器,为数字经济发展增添新动力
今日,以“芯加速 行至远”为主题的第四代英特尔至强新品发布会在北京正大中心盛大举行。
至顶网
业界供稿 2023-01-11 17:56:41
博世研究院发布全球首个大规模AI智能助手技能生态调研报告
这是全球首个针对AI智能助手技能生态系统的大规模数据分析研究。博世研究院与卡内基梅隆大学合作,调研了超过4万个AI技能,发现了爆发式增长、严重的供需失衡和安全风险等关键问题。研究揭示46.3%的技能存在重复,39%具有不同程度的安全风险,为这个新兴数字生态的健康发展提供了重要参考。
至顶网
科技行者 2026-02-11 13:02:52
AI模型能否真正理解网络表情包的恶意内容?香港浸会大学团队开发出全新智能检测框架
香港浸会大学等机构联合开发的AdamMeme框架,通过多AI智能体协作,能够动态生成个性化测试样本来评估AI模型理解网络表情包恶意内容的能力。该框架突破了传统静态评估的局限,针对每个模型的弱点进行深度探测,实验显示即使是GPT-4o等顶级模型也存在认知盲点,为AI安全评估提供了新思路。
至顶网
科技行者 2025-07-18 09:38:00
麻省理工团队揭秘:AI如何仅靠语音就能"读懂"你在什么地方说话
麻省理工学院研究团队开发出革命性AI技术,能够仅通过分析音频信号就准确推断出说话者所处的三维空间环境。该技术利用声音在不同空间中的独特传播特征,让AI系统像声学侦探一样重建完整的空间几何信息。在测试中,系统的空间尺寸预测精度达95%以上,声学特性匹配度超90%。这项创新为智能家居、虚拟现实、音频制作等领域带来广阔应用前景,有望让未来的智能设备真正理解和适应人类的生活环境。
至顶网
科技行者 2025-08-28 14:50:35
让专家"接力"工作,AI模型变得更聪明了——西北大学等顶尖院校联手破解人工智能效率难题
西北大学等顶尖院校联合提出专家链(CoE)架构,通过让AI模型内部专家依次协作而非并行工作,在相同计算预算下将数学推理验证损失从1.20降至1.12,同时减少17.6%-42%内存使用。这种"接力式"处理方式为AI模型扩展提供了新维度,证明了智能协作比简单资源堆砌更有效。
至顶网
科技行者 2025-06-30 10:53:20
AI故事画师的"审查员":弗吉尼亚理工大学让机器学会画出前后一致的连环画
弗吉尼亚理工大学研究团队开发了名为"审查与修复"的AI系统,通过四个专业化AI组件协作,解决了AI绘画中角色外观不一致的问题。该系统能自动检测并修正故事插图中的视觉不一致性,大幅提升了AI生成连续图像的质量和连贯性,为创意产业提供了可靠的智能助手,展现了多AI协作解决复杂问题的新范式。
至顶网
科技行者 2025-06-27 09:34:21
企业可持续发展“知行”难“合一”?IBM提出新解法
IBM长期致力于打造一个更加可持续、更公平的未来。
至顶网
业界供稿 2022-05-19 13:32:29
<
上一页
175
176
177
178
179
180
181
182
183
184
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号