LLM Twin Course By aitool.zyqok.com April 1, 2024 - 2 min read 免费课程,向你展示如何设计、训练和部署一个准备就绪的生产标准的 LLM(大型语言模型) read more
SSM-Transformer By aitool.zyqok.com March 29, 2024 - 2 min read AI21推出了首个生产级别的基于Mamba的模型Jamba,这是一个创新的SSM-Transformer混合架构模型 read more
Grok-1.5 By aitool.zyqok.com March 29, 2024 - 2 min read 具备更强的推理能力和128,000词元的上下文长度,即将在𝕏平台提供 read more
Qwen1.5-MoE By aitool.zyqok.com March 29, 2024 - 2 min read 阿里巴巴一款小型 MoE 模型,只有 27 亿个激活参数,但性能与最先进的 7B 模型(如 Mistral 7B 和 Qwen1.5-7B)相匹配 read more