模型压缩与量化工具

通过剪枝（如 L1 正则化）、量化（如 8 位整数推理）和知识蒸馏技术，在保持功能的前提下减少模型体积。支持硬件感知优化，针对边缘设备（如手机、IoT）生成特定格式（如 TensorFlow Lite、ONNX Runtime）。例如，采用渐进式剪枝策略，先去除冗余连接再进行量化，确保压缩后模型准确率损失低于 1%。部分工具集成可视化分析，对比压缩前后的激活图差异。