flash-attention-minimal By aitool.zyqok.com March 9, 2024 - 2 min read Flash Attention的简化CUDA和PyTorch实现,旨在教育性和可读性。 read more
Chat Nio By aitool.zyqok.com March 9, 2024 - 2 min read 下一代 AI 一站式解决方案,支持丰富的 AI 聊天对话功能和多种模型 read more
OpenLLMetry By aitool.zyqok.com March 8, 2024 - 2 min read 基于OpenTelemetry构建的,用于LLM应用程序的开源可观测性扩展 read more