QwQ-32B
QwQ-32B是Qwen系列的一个推理模型,参数量为325亿。相较于传统的指令微调模型,QwQ-32B具备更强的推理能力,尤其在解决难题时表现更佳,可以与DeepSeek-R1, o1-mini等先进推理模型相媲美。它基于Qwen2.5,使用了RoPE, SwiGLU, RMSNorm, 和 Attention QKV bias等技术。模型上下文长度为131,072 tokens。为了获得最佳性能,建议在生成时加入"
需要开发系统,APP,大模型私有化部署,模型训练,欢迎联系微信手机同号:13067972109