任学强的博客
关于我
标签:
推理效能优化
AI模型压缩量化技术:轻量化与效能提升
AI模型压缩量化技术通过低比特量化、结构化剪枝等方法,大幅减小模型体积与计算负载,实现轻量化部署。在保持精度的…
2025年9月11日