Qwen3是阿里巴巴Qwen团队发布的最新大语言模型系列,最大创新在于将"思考模式"和"非思考模式"融合到单一框架中,允许用户根据需求动态切换推理深度。模型规模从0.6B到235B不等,包括密集和混合专家架构,支持119种语言(较前代扩展90种),训练数据达36万亿词量。通过"思考预算"机制,用户可灵活控制推理深度与速度平衡。评估结果显示,Qwen3在代码生成、数学推理等任务上达到顶尖水平,且所有模型以Apache 2.0许可开放使用,推动AI社区共同发展。
至顶网 科技行者 2025-07-08 09:41:18