任学强的博客
关于我
标签:
部署应用
AI模型压缩量化技术研究与应用
针对AI模型部署中资源消耗大、实时性差的问题,本文研究模型压缩量化技术,通过低比特量化、结构化剪裁等方法,在保…
2025年10月19日