AI文摘

blog-thum
大模型量化技术原理-SpQR

【点击】加入大模型技术交流群近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,从而导致模型变得越来越大,因此,我们需要一些大模型压缩技术来降低模型部署的成本

read more
blog-thum
生成式AI应用设计模式全面指南​

【点击】加入大模型技术交流群在构建新事物时,我们都会遵循一些久经考验的方法、途径和模式。这句话对于软件工程人员来说非常正确,但对于生成式AI和AI本身来说,情况可能并非如此。对于生成式AI等新兴技术,

read more