GrokAdamW By aitool.zyqok.com August 9, 2024 - 2 min read GrokAdamW 是一种结合 Grokfast 和 AdamW 优化器优势加速深度学习模型训练的新型优化器。 read more
Llama3-S By aitool.zyqok.com August 9, 2024 - 2 min read Llama3-S是一个研究让语言模型具备“聆听”能力的开源实验项目。 read more
ml_mdm By aitool.zyqok.com August 9, 2024 - 2 min read `ml_mdm` 是一个用于高效训练高质量文本到图像扩散模型的 Python 包。 read more
Qwen2-Math By aitool.zyqok.com August 9, 2024 - 2 min read Qwen2-Math 是一系列专注于数学问题解决的高性能大语言模型。 read more
Transformer Explainer By aitool.zyqok.com August 8, 2024 - 2 min read Transformer Explainer 是一个互动工具,帮助用户了解Transformer模型如GPT的工作原理。 read more