搜索 bob这个平台怎么样【網纸——YB233典CN—

阿里巴巴Qwen团队打造史上最强多模态AI：一个模型搞定文字、语音、图像和视频，实时对话延迟仅234毫秒

阿里巴巴Qwen团队发布的Qwen3-Omni实现了AI领域的重大突破，首次让单一模型在文字、语音、图像、视频处理上都达到专业水平，无任何性能损失。该系统支持119种文字语言，实时对话延迟仅234毫秒，在36项测试中32项达到开源最佳。采用创新的"思考者-表达者"架构和多码本流式生成技术，为真正智能的多模态AI助手奠定了基础。

至顶网科技行者 2025-10-09 10:08:25

大语言模型能否像人类一样产生意见分歧？苏黎世联邦理工学院团队揭示AI标注者的局限性

苏黎世联邦理工学院团队通过大规模实验发现，当前主流大语言模型在预测人类标注分歧方面存在显著局限。研究对比了RLVR和RLHF两类模型，发现RLVR模型虽然擅长处理标准化任务，但在理解观点多样性方面表现不佳。这一发现对AI标注系统的实际应用具有重要指导意义。

至顶网科技行者 2025-06-30 10:52:42

巴赫切希尔大学发现：智能目标检测模型在模糊噪音环境中的"视力"挑战

巴赫切希尔大学研究团队通过对五种不同规模YOLO模型的量化鲁棒性测试发现，静态INT8量化虽能带来1.5-3.3倍速度提升，但会显著降低模型对噪音等图像损伤的抵抗能力。他们提出的混合校准策略仅在大型模型处理噪音时有限改善，揭示了效率与鲁棒性平衡的复杂挑战。

至顶网科技行者 2025-09-05 15:12:55

十年回首，“左手代码，右手诗”的理想主义者

现实中的理想主义者是痛苦的，还是幸福的？工程师在工作中追寻的是什么？这是一个资深工程师，一个数次创业的理想主义者的故事。

至顶网尼酱 2022-06-16 15:38:15

阿里巴巴推出WebWatcher：一个能看图能思考的AI搜索助手，让信息查找像侦探破案一样智能

阿里巴巴通义实验室推出WebWatcher，这是首个能同时处理图片和文字的深度研究AI助手。它像数字侦探一样，能主动搜索网页、分析图片、执行计算，通过多步推理解决复杂问题。在多项基准测试中，WebWatcher显著超越GPT-4o等知名系统，特别是在需要跨模态信息整合的任务中表现突出，代表了AI助手向真正智能推理的重要进展。

至顶网科技行者 2025-10-10 09:31:56

英特尔的未来掌握在苹果公司的手中？

为了竞争，英特尔需要一种新的战略——这正是该公司的新任首席执行官Pat Gelsinger正在试图为这家公司带来的东西——以及美国和欧洲政府的财政支持。非常重要的一点是，其芯片代工业务的规模。这正是苹果公司能够成为关键的地方。

至顶网 siliconANGLE 2021-05-07 11:20:11

对话谷歌出海创业加速器：打出“选赛道、找抓手和PMF”的组合拳

Polyverse联合创始人兼CGO邱子珺和大逐创新CEO林军峰，与谷歌出海创业加速器全球负责人Sami Kizilbash一起接受了科技行者的采访，探讨了中国企业出海的心得、谷歌出海创业加速器的赋能、不同国家创业者的特质等一系列话题。

至顶网科技行者 2023-09-18 19:15:09

Salesforce研究院BLIP3-o：让AI同时看懂图片又能画出图片的统一多模态模型

Salesforce研究院联合多所知名大学开发的BLIP3-o是首个真正统一图像理解与生成的AI模型。通过创新的"CLIP特征+流匹配"架构和顺序训练策略，实现了在保持强大图像理解能力的同时获得优质图像生成效果。模型在多项评测中表现优异，并通过专门的6万张图像指令调优数据集显著提升了美学质量。

至顶网科技行者 2025-07-09 15:45:10

全球机器学习教父Tom Mitchell宣布加入松鼠AI

Tom Mitchell教授，正式宣布接受松鼠AI的邀约，出任Chief AI officer一职。

至顶网业界供稿 2018-11-25 17:38:28

微软让机器学习也能"闻"出数据异常了：就像侦探闻到可疑气味一样精准

微软亚洲研究院开发的MSAD系统通过模拟侦探的多重感知能力，实现了突破性的无监督异常检测。该系统融合数值、序列和语义三种感知模式，无需异常样本训练即可精准识别数据异常。在网络安全、金融风控、工业监控等领域测试中表现优异，为智能异常检测技术开辟了新的发展方向。

至顶网科技行者 2025-08-26 10:16:59

波兰语AI新突破：仅用110亿参数，竟能击败千亿级语言模型！SpeakLeash团队的Bielik 11B v2如何做到的？

SpeakLeash团队联合波兰多所大学开发的Bielik 11B v2语言模型，仅用110亿参数就在多项测试中击败了参数量大2-6倍的模型。该模型专门针对波兰语优化，采用创新的深度上扩架构和智能训练技术，在波兰语理解、跨语言能力和数学推理等方面表现卓越，为非英语语言AI发展提供了新路径。

至顶网科技行者 2025-07-08 09:33:08

机器人终于学会"预测未来"：上海AI实验室开发出能看到下一秒的智能机器人大脑

上海AI实验室开发的F1机器人"大脑"实现了革命性突破，让机器人首次具备"预见未来"的能力。通过理解、生成、执行三个专家模块协作，F1能预测任务执行后的画面并据此制定行动策略。在多个机器人平台测试中，F1的成功率大幅超越传统方法，特别是在动态环境和长期规划任务中表现卓越，为机器人智能化发展开辟了新道路。

至顶网科技行者 2025-09-23 10:01:56

把大象带到中国，一共需要几步？

印象笔记宣布脱离Evernote全球业务，成为第一个独立于母公司的中国互联网公司，这很容易让人想起这个关于大象的冷笑话——把印象笔记这样“一头大象”带回中国一共经历了几个步骤

至顶网业界供稿 2018-07-13 14:28:35

伊斯法罕医科大学团队突破：让AI像人类一样"推理"预测新药成败

伊斯法罕医科大学研究团队开发出DrugReasoner，这是首个能够像人类专家一样"推理"的药物审批预测AI系统。该系统基于LLaMA架构，不仅能预测新药是否会被批准，更重要的是能详细解释推理过程。在多项测试中表现优异，AUC值达0.732，明显超越传统方法，为制药行业提供了前所未有的透明化决策工具，有望显著提高药物研发效率。

至顶网科技行者 2025-09-03 12:28:51

Lightricks团队打造视频生成新利器：2秒生成5秒视频的LTX-Video模型

LTX-Video是由以色列Lightricks公司开发的革命性开源视频生成模型，能够在2秒内生成5秒高质量视频，实现了比实时播放更快的生成速度。该模型创新性地整合了视频压缩和生成过程，采用1:192的超高压缩比和共享去噪机制，在人类评估中表现显著优于同类模型。作为完全开源的项目，它为教育、营销、内容创作等多个领域提供了强大而accessible的视频生成能力。

至顶网科技行者 2025-09-16 11:09:43

苹果研究院首创AI音频技术：让声音拥有记忆力，语音助手即将迎来智能化革命

苹果公司研究团队开发出革命性语音AI技术RealTimeVoice，首次实现语音助手的完美记忆力和实时对话能力。该技术通过流式音频处理和创新的记忆缓存机制，让AI能够记住完整对话历史的同时保持快速响应，反应速度比传统系统提升一倍。这项突破将彻底改变人机语音交互体验，让数字助手真正成为理解用户的智能伙伴。

至顶网科技行者 2025-08-20 18:04:48

ServiceNow推出音频大模型评估神器：AI语音助手测评从此不再头疼

ServiceNow团队开发的AU-Harness是首个专门针对AI语音助手的综合评估工具包。该工具通过创新的并行处理和标准化测试协议，将评估效率提升127%，涵盖19项测试任务。研究引入了两个全新测试类别：时间感知的对话分离和复杂的口语推理能力。通过380多项测试揭示，当前AI语音模型在基础识别方面表现良好，但在复杂推理和时间理解上仍存在显著差距，为未来技术改进指明了方向。

至顶网科技行者 2025-09-25 14:40:53

我在德国成了“黑户”——一位程序员的坎坷移民路

在上一篇文章从阿里辞职后不再内卷——一位德国程序员的“躺平”之路中，成功移民德国的唐小牛曾说过“国外的月亮并没有比中国的圆”，他的朋友王小曾就是个典型的例子。相比于唐小牛的顺利，王小曾的德国移民路可谓处处坎坷。

至顶网尼酱 2022-06-16 16:37:48

「产后抑郁」新疗法：从雌性与雄性动物的大脑行为说起

“雄性与雌性的行为为何有所不同？”

至顶网科技行者 2020-12-25 15:20:54

得与失——一位程序员的创业之路

每一个程序员的心中或许都有这样一个梦：有一天，做出一个心中的完美产品，让全世界的人使用它。蒋南国和他的合伙人创业七载，经历了无数的风风雨雨。作为一个技术合伙人，当拥有了对产品的决策权，他是否实现了自己的梦想，又会遭遇哪些坎坷？

至顶网尼酱 2022-06-28 10:58:46