搜一下
用了 0.013607秒,为您找到
bob
怎么样
好不好
網纸
YB233
相关内容578 条
阿里Qwen团队重磅发布:一个AI助手同时懂看听说,还能实时"思考+说话"
阿里Qwen团队发布了突破性多模态AI模型Qwen2.5-Omni,能同时理解文字、图片、音频和视频输入,并实时生成文字和语音回应。该模型采用创新的TMRoPE时间对齐技术和Thinker-Talker架构,实现了真正的流式多模态交互,在多项基准测试中达到最先进性能。
至顶网
科技行者 2025-08-04 13:32:16
阿里达摩院推出VL-Cogito:多模态推理能力突破的渐进式课程强化学习框架
阿里达摩院联合复旦大学开发了VL-Cogito多模态推理模型,采用创新的渐进式课程强化学习框架PCuRL。该系统模仿人类学习方式,通过三阶段训练让AI学会根据问题难度智能调整回答详细程度。VL-Cogito在十个基准测试中表现卓越,展现了在数学、科学、逻辑推理等多领域的强大能力,为多模态AI实际应用开辟了新路径。
至顶网
科技行者 2025-08-06 11:08:34
中英文语音对话模型的新挑战:北大团队揭示AI语音助手在复杂对话中的真实表现
北京大学团队创建C3基准测试集,系统评估十款主流语音对话模型处理复杂对话的能力。研究发现即使最先进的GPT-4o音频版在英文对话中准确率仅55.68%,中文表现更差。语义歧义和省略现象是最大挑战,中文处理难度显著高于英文。该研究首次揭示了语音AI在真实对话场景中的局限性,为技术发展提供重要指引。
至顶网
科技行者 2025-10-11 14:32:37
Meta 让视频生成像聊天一样轻松:实时AI导演帮你随时拍出想要的画面
Meta和加州大学伯克利分校的研究团队开发了StreamDiT技术,实现了首个真正意义上的实时AI视频生成系统。该技术能够像熟练摄影师一样根据文字描述即时生成高质量视频,支持用户在生成过程中实时调整内容。通过创新的"缓冲流匹配"训练方法和高效的模型架构设计,StreamDiT在单GPU上实现了16FPS的实时性能,为视频创作、游戏、教育等领域开辟了全新可能性。
至顶网
科技行者 2025-07-11 09:50:13
美国辛辛那提大学讲座教授、《工业大数据》作者李杰:大数据助力“中国智造”弯道超车
在11日的主会现场,美国辛辛那提大学(Univ.of Cincinnati) 讲座教授、《工业大数据》作者李杰首先发表题为“大数据助力‘中国智造’弯道超车”的主旨演讲。
至顶网
至顶网网络频道 2018-07-11 10:26:49
开发者与AI助手的真实对话:当代码生成遇上现实编程场景
这项研究分析了82,845个真实开发者与AI助手的编程对话,发现AI回复比开发者提问长14倍,68%为多轮对话。Web开发和机器学习是最热门话题。AI代码质量存在问题:Python代码83.4%命名不规范,JavaScript代码75.3%有未定义变量。研究为改进AI编程助手提供了重要参考。
至顶网
科技行者 2025-10-09 09:44:18
PTC面向角色的 PLM导航技术
PTC
至顶网
业界供稿 2018-06-06 11:01:04
华为前员工创业四年,资产冻结
赵昱在华为的第一课就是《把信交给加西亚》,在美西战争中,中尉罗文要把信交给不知身在何处、不知模样的“加西亚将军”,在没有任何援助的情况下,他仍然完成了任务。
至顶网
尼酱 2023-04-07 11:20:09
从乡下放牛娃到大厂AI顾问:我用本硕七年,重写自己的人生
LangGPT创始者云中江树的双面人生
至顶网
杨淼 2024-11-19 09:41:28
VITA-1.5:让计算机像人一样同时"看"和"说话"的革命性突破
VITA-1.5是首个实现GPT-4o级别实时视觉语音交互的开源多模态大语言模型。通过创新的三阶段训练策略,系统能够同时处理图像、视频和语音信息,实现端到端的语音对话,无需外部ASR或TTS模块。在多项基准测试中表现优异,语音识别准确率达到97.8%以上,为多模态人机交互开辟了新的可能性。
至顶网
科技行者 2025-09-16 13:03:42
Alexa+预览:一场近乎哲学的体验测试
亚马逊Alexa+预览版正缓慢向用户开放,这款升级版语音助手采用生成式AI重新构建,具备更自然的对话能力和情感智能。经过数周测试发现,Alexa+在处理复杂任务和记忆对话方面有所改进,能够集成Uber、Spotify等第三方服务。然而,其表现不够稳定,存在记忆不准确、回复冗长、功能执行不完整等问题,体现了当前AI工具期望与现实之间的差距。
至顶网
engadget 2025-07-28 09:15:12
港中文突破!让AI学会"一步步思考"生成图像,告别胡乱画图时代
港中文团队开发的T2I-R1系统首次让AI学会"思考式"图像生成,通过语义规划和细节优化的双层推理机制,在复杂图像生成任务上比基础模型提升13-19%,甚至超越了业界最强的FLUX.1模型,为AI创意产业应用开辟新路径。
至顶网
科技行者 2025-07-10 15:42:03
博世中国:让无人车学会像人类一样从"不完美地图"中找路的革命性技术
博世中国联合多家知名院校开发的DiffSemanticFusion技术,通过创新的多模态信息融合和在线地图扩散模块,让无人驾驶汽车能在地图不完美的情况下准确理解环境。该技术在轨迹预测上提升5.1%性能,在复杂驾驶场景中提升15%,为解决无人驾驶对完美地图的依赖问题提供了突破性方案。
至顶网
科技行者 2025-08-12 11:11:02
UniTEX:打破传统纹理生成限制,HKUST和Light Illusion团队带来高保真3D纹理生成新方法
UniTEX是香港科技大学与Light Illusion团队联合开发的创新3D纹理生成框架,彻底突破了传统UV映射的限制。该技术引入了"纹理函数"概念,将纹理定义为3D空间中的连续函数,完全绕过了拓扑歧义问题。配合精心设计的大型纹理模型和高效的扩散Transformer微调策略,UniTEX能从单一参考图像生成高保真、完整的3D纹理,同时在艺术家创建和AI生成的复杂模型上都表现出色,为游戏、VR和数字内容创作领域带来革命性变化。
至顶网
科技行者 2025-06-03 15:16:14
鼎捷软件:“数字化转型”喧嚣下,企业管理者们需要冷思考
数字化转型,不做被大势裹挟着挪步的人。
至顶网
周雅 2021-12-06 18:09:04
凯文·凯利2018最新演讲:未来25年将发生什么
《连线》杂志创始主编凯文·凯利发表了《What is Next》的主题演讲。凯文·凯利被看作是“网络文化”的发言人和观察者,他的书可能大家也很了解,《失控》《科技想要什么》和《必然》等书籍,影响了很多信息科技领域的从业者,人们也经常亲昵地称他为KK,
至顶网
至顶网存储频道 2018-07-11 16:47:39
清华大学突破性研究:让AI像人眼一样实时"看懂"动态世界
清华大学团队开发的StreamVGGT实现了首个实时4D视觉几何重建系统,通过模仿人类视觉的时间因果感知机制,将处理速度提升30倍而精度几乎不变。该技术采用流式处理架构和知识蒸馏训练,为自动驾驶、AR/VR、机器人导航等领域提供了突破性解决方案。
至顶网
科技行者 2025-07-25 09:36:49
当AI聊天助手遇上挑剔用户:Salesforce如何让机器真正理解你的心思
Salesforce AI Research联合伊利诺伊大学开发的UserBench研究揭示了当前AI助手的重大缺陷:尽管技术上表现出色,但在理解用户真实需求方面表现糟糕。最先进的AI模型完全满足用户需求的成功率仅20%,发现隐性偏好的能力不足30%。这项研究创建了专门的用户中心评估环境,为开发真正理解用户、能够成为人类理解型伙伴的AI助手指明了方向,标志着AI发展从"任务执行者"向"用户协作者"的重要转变。
至顶网
科技行者 2025-08-14 12:12:18
香港中文大学团队让AI学会画图:从文字到精美矢量图的创作之路
香港中文大学团队开发出让AI学会矢量图形编程的创新方法,通过强化学习和跨模态奖励机制,成功将开源模型的绘图能力提升到商业级水平。研究建立了SGP-GenBench评估体系,发现AI不仅学会精确绘图,还发展出分层构建、创意补充等智能行为模式,为AI辅助设计开辟新路径。
至顶网
科技行者 2025-09-23 13:38:07
南京大学联合美团发布ScaleEnv框架:让AI智能体自学成才的终极训练场
这项研究开发了ScaleEnv框架,能够从简单关键词自动构建完整的AI训练环境。通过程序化测试和双阶段构建,确保虚拟环境的真实可靠。实验证明,在此框架训练的AI智能体在跨领域测试中表现显著提升,验证了环境多样性对AI泛化能力的重要作用,为AI训练方法开辟了新方向。
至顶网
科技行者 2026-02-12 13:32:27
<
上一页
20
21
22
23
24
25
26
27
28
29
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号