任学强的博客
关于我
标签:
低比特推理
AI模型压缩与量化:轻量化部署关键技术
AI模型压缩与量化是实现轻量化部署的核心技术。针对模型体积大、计算资源消耗高的问题,通过剪枝、知识蒸馏、量化(…
2025年9月8日