AI新工具
banner

QwQ-32B


介绍:

QwQ-32B是Qwen系列推理模型,具有325亿参数,擅长解决难题,推荐使用特定参数以标准化输出格式。









QwQ-32B

QwQ-32B是Qwen系列的一个推理模型,参数量为325亿。相较于传统的指令微调模型,QwQ-32B具备更强的推理能力,尤其在解决难题时表现更佳,可以与DeepSeek-R1, o1-mini等先进推理模型相媲美。它基于Qwen2.5,使用了RoPE, SwiGLU, RMSNorm, 和 Attention QKV bias等技术。模型上下文长度为131,072 tokens。为了获得最佳性能,建议在生成时加入"\n"引导模型思考,并使用适当的采样参数(Temperature=0.6, TopP=0.95, TopK=20-40)。 对于长输入,可以使用YaRN技术优化。 该模型支持vLLM部署。

可关注我们的公众号:宇田ai人工智能

需要开发系统,APP,大模型私有化部署,模型训练,欢迎联系微信手机同号:13067972109