mnn_offline_quant离线量化失败 #2981

DommyWorld · 2024-07-31T09:35:36Z

使用mnn_offline_quant离线量化，模型是多输入，量化后算子仍然是float32类型。但量化过程没有报错，模型文件大小有所缩减，但是模型推理速度并没有上升。附上量化前和量化后的模型。
量化后.zip
量化前.zip

v0jiuqi · 2024-08-26T00:12:53Z

多输入的模型可以直接采取权重量化的方式。-MNNConvert --WeightQuantBits这样，具体使用方式参考文档。编译时打开-DMNN_LOW_MEMORY=ON，推理时memory mode使用 low

Provide feedback