搜一下
用了 0.057587秒,为您找到
bob
这个
平台
怎么样
網纸
YB233
相关内容463 条
阿里巴巴Qwen团队打造史上最强多模态AI:一个模型搞定文字、语音、图像和视频,实时对话延迟仅234毫秒
阿里巴巴Qwen团队发布的Qwen3-Omni实现了AI领域的重大突破,首次让单一模型在文字、语音、图像、视频处理上都达到专业水平,无任何性能损失。该系统支持119种文字语言,实时对话延迟仅234毫秒,在36项测试中32项达到开源最佳。采用创新的"思考者-表达者"架构和多码本流式生成技术,为真正智能的多模态AI助手奠定了基础。
至顶网
科技行者 2025-10-09 10:08:25
大语言模型能否像人类一样产生意见分歧?苏黎世联邦理工学院团队揭示AI标注者的局限性
苏黎世联邦理工学院团队通过大规模实验发现,当前主流大语言模型在预测人类标注分歧方面存在显著局限。研究对比了RLVR和RLHF两类模型,发现RLVR模型虽然擅长处理标准化任务,但在理解观点多样性方面表现不佳。这一发现对AI标注系统的实际应用具有重要指导意义。
至顶网
科技行者 2025-06-30 10:52:42
巴赫切希尔大学发现:智能目标检测模型在模糊噪音环境中的"视力"挑战
巴赫切希尔大学研究团队通过对五种不同规模YOLO模型的量化鲁棒性测试发现,静态INT8量化虽能带来1.5-3.3倍速度提升,但会显著降低模型对噪音等图像损伤的抵抗能力。他们提出的混合校准策略仅在大型模型处理噪音时有限改善,揭示了效率与鲁棒性平衡的复杂挑战。
至顶网
科技行者 2025-09-05 15:12:55
十年回首,“左手代码,右手诗”的理想主义者
现实中的理想主义者是痛苦的,还是幸福的?工程师在工作中追寻的是什么?这是一个资深工程师,一个数次创业的理想主义者的故事。
至顶网
尼酱 2022-06-16 15:38:15
阿里巴巴推出WebWatcher:一个能看图能思考的AI搜索助手,让信息查找像侦探破案一样智能
阿里巴巴通义实验室推出WebWatcher,这是首个能同时处理图片和文字的深度研究AI助手。它像数字侦探一样,能主动搜索网页、分析图片、执行计算,通过多步推理解决复杂问题。在多项基准测试中,WebWatcher显著超越GPT-4o等知名系统,特别是在需要跨模态信息整合的任务中表现突出,代表了AI助手向真正智能推理的重要进展。
至顶网
科技行者 2025-10-10 09:31:56
英特尔的未来掌握在苹果公司的手中?
为了竞争,英特尔需要一种新的战略——这正是该公司的新任首席执行官Pat Gelsinger正在试图为这家公司带来的东西——以及美国和欧洲政府的财政支持。非常重要的一点是,其芯片代工业务的规模。这正是苹果公司能够成为关键的地方。
至顶网
siliconANGLE 2021-05-07 11:20:11
对话谷歌出海创业加速器:打出“选赛道、找抓手和PMF”的组合拳
Polyverse联合创始人兼CGO邱子珺和大逐创新CEO林军峰,与谷歌出海创业加速器全球负责人Sami Kizilbash一起接受了科技行者的采访,探讨了中国企业出海的心得、谷歌出海创业加速器的赋能、不同国家创业者的特质等一系列话题。
至顶网
科技行者 2023-09-18 19:15:09
Salesforce研究院BLIP3-o:让AI同时看懂图片又能画出图片的统一多模态模型
Salesforce研究院联合多所知名大学开发的BLIP3-o是首个真正统一图像理解与生成的AI模型。通过创新的"CLIP特征+流匹配"架构和顺序训练策略,实现了在保持强大图像理解能力的同时获得优质图像生成效果。模型在多项评测中表现优异,并通过专门的6万张图像指令调优数据集显著提升了美学质量。
至顶网
科技行者 2025-07-09 15:45:10
全球机器学习教父Tom Mitchell宣布加入松鼠AI
Tom Mitchell教授,正式宣布接受松鼠AI的邀约,出任Chief AI officer一职。
至顶网
业界供稿 2018-11-25 17:38:28
微软让机器学习也能"闻"出数据异常了:就像侦探闻到可疑气味一样精准
微软亚洲研究院开发的MSAD系统通过模拟侦探的多重感知能力,实现了突破性的无监督异常检测。该系统融合数值、序列和语义三种感知模式,无需异常样本训练即可精准识别数据异常。在网络安全、金融风控、工业监控等领域测试中表现优异,为智能异常检测技术开辟了新的发展方向。
至顶网
科技行者 2025-08-26 10:16:59
波兰语AI新突破:仅用110亿参数,竟能击败千亿级语言模型!SpeakLeash团队的Bielik 11B v2如何做到的?
SpeakLeash团队联合波兰多所大学开发的Bielik 11B v2语言模型,仅用110亿参数就在多项测试中击败了参数量大2-6倍的模型。该模型专门针对波兰语优化,采用创新的深度上扩架构和智能训练技术,在波兰语理解、跨语言能力和数学推理等方面表现卓越,为非英语语言AI发展提供了新路径。
至顶网
科技行者 2025-07-08 09:33:08
机器人终于学会"预测未来":上海AI实验室开发出能看到下一秒的智能机器人大脑
上海AI实验室开发的F1机器人"大脑"实现了革命性突破,让机器人首次具备"预见未来"的能力。通过理解、生成、执行三个专家模块协作,F1能预测任务执行后的画面并据此制定行动策略。在多个机器人
平台
测试中,F1的成功率大幅超越传统方法,特别是在动态环境和长期规划任务中表现卓越,为机器人智能化发展开辟了新道路。
至顶网
科技行者 2025-09-23 10:01:56
把大象带到中国,一共需要几步?
印象笔记宣布脱离Evernote全球业务,成为第一个独立于母公司的中国互联网公司,这很容易让人想起
这个
关于大象的冷笑话——把印象笔记这样“一头大象”带回中国一共经历了几个步骤
至顶网
业界供稿 2018-07-13 14:28:35
伊斯法罕医科大学团队突破:让AI像人类一样"推理"预测新药成败
伊斯法罕医科大学研究团队开发出DrugReasoner,这是首个能够像人类专家一样"推理"的药物审批预测AI系统。该系统基于LLaMA架构,不仅能预测新药是否会被批准,更重要的是能详细解释推理过程。在多项测试中表现优异,AUC值达0.732,明显超越传统方法,为制药行业提供了前所未有的透明化决策工具,有望显著提高药物研发效率。
至顶网
科技行者 2025-09-03 12:28:51
Lightricks团队打造视频生成新利器:2秒生成5秒视频的LTX-Video模型
LTX-Video是由以色列Lightricks公司开发的革命性开源视频生成模型,能够在2秒内生成5秒高质量视频,实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程,采用1:192的超高压缩比和共享去噪机制,在人类评估中表现显著优于同类模型。作为完全开源的项目,它为教育、营销、内容创作等多个领域提供了强大而accessible的视频生成能力。
至顶网
科技行者 2025-09-16 11:09:43
苹果研究院首创AI音频技术:让声音拥有记忆力,语音助手即将迎来智能化革命
苹果公司研究团队开发出革命性语音AI技术RealTimeVoice,首次实现语音助手的完美记忆力和实时对话能力。该技术通过流式音频处理和创新的记忆缓存机制,让AI能够记住完整对话历史的同时保持快速响应,反应速度比传统系统提升一倍。这项突破将彻底改变人机语音交互体验,让数字助手真正成为理解用户的智能伙伴。
至顶网
科技行者 2025-08-20 18:04:48
ServiceNow推出音频大模型评估神器:AI语音助手测评从此不再头疼
ServiceNow团队开发的AU-Harness是首个专门针对AI语音助手的综合评估工具包。该工具通过创新的并行处理和标准化测试协议,将评估效率提升127%,涵盖19项测试任务。研究引入了两个全新测试类别:时间感知的对话分离和复杂的口语推理能力。通过380多项测试揭示,当前AI语音模型在基础识别方面表现良好,但在复杂推理和时间理解上仍存在显著差距,为未来技术改进指明了方向。
至顶网
科技行者 2025-09-25 14:40:53
我在德国成了“黑户”——一位程序员的坎坷移民路
在上一篇文章从阿里辞职后不再内卷——一位德国程序员的“躺平”之路中,成功移民德国的唐小牛曾说过“国外的月亮并没有比中国的圆”,他的朋友王小曾就是个典型的例子。相比于唐小牛的顺利,王小曾的德国移民路可谓处处坎坷。
至顶网
尼酱 2022-06-16 16:37:48
「产后抑郁」新疗法:从雌性与雄性动物的大脑行为说起
“雄性与雌性的行为为何有所不同?”
至顶网
科技行者 2020-12-25 15:20:54
得与失——一位程序员的创业之路
每一个程序员的心中或许都有这样一个梦:有一天,做出一个心中的完美产品,让全世界的人使用它。 蒋南国和他的合伙人创业七载,经历了无数的风风雨雨。作为一个技术合伙人,当拥有了对产品的决策权,他是否实现了自己的梦想,又会遭遇哪些坎坷?
至顶网
尼酱 2022-06-28 10:58:46
<
上一页
16
17
18
19
20
21
22
23
24
下一页
>
©2019 北京第二十六维信息技术有限公司(至顶网)版权所有.
京ICP备15039648号-7
京ICP证161336号 京公网安备11010802021500号