ADD whisper #53

kyakuno · 2023-03-07T11:39:30Z

https://github.com/usefulsensors/openai-whisper

kyakuno · 2024-04-23T12:04:37Z

tflite version
https://github.com/nyadla-sys/whisper.tflite?tab=readme-ov-file

kyakuno · 2024-04-23T12:08:07Z

medium model
nyadla-sys/whisper.tflite#11

kyakuno · 2024-04-24T01:31:52Z

入力は80x3000のmelspectrogram、出力は1x448のtoken_id。

kyakuno · 2024-04-24T01:32:28Z

MatmulはFCになっている。Geluが追加されている。

kyakuno · 2024-04-24T02:50:24Z

このモデルはweightはint8だが、tensorはfloatのweight quantizationになっている。

kyakuno · 2024-04-24T03:21:44Z

generateでラップしない場合のtfliteファイル。こちらは素直なencoder/decoder統合モデル。

kyakuno · 2024-04-24T03:26:56Z

kv_cacheはoutputsにつながっているが、inputsにはつながっていないので、Stateを保存しておく仕組みがありそう。

kyakuno · 2024-04-24T03:56:07Z

量子化の話
tensorflow/tensorflow#58451

kyakuno · 2024-04-24T04:30:13Z

whisperはint8では精度不足という話。

It might not be possible to get expected results from int8 models ( because of model architecture itself). So, Work around might be to use hybrid models as you suggested.

kyakuno · 2024-04-24T04:33:51Z

下記もmixed precisionとdynamic quantizationで実装されている。
https://github.com/microsoft/Olive/tree/main/examples/whisper

kyakuno added the high priority label Apr 23, 2024

kyakuno mentioned this issue Apr 24, 2024

ADD Whisper #82

Open

kyakuno self-assigned this Apr 24, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ADD whisper #53

ADD whisper #53

kyakuno commented Mar 7, 2023

kyakuno commented Apr 23, 2024

kyakuno commented Apr 23, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024 •

edited

Loading

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

ADD whisper #53

ADD whisper #53

Comments

kyakuno commented Mar 7, 2023

kyakuno commented Apr 23, 2024

kyakuno commented Apr 23, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024 • edited Loading

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024

kyakuno commented Apr 24, 2024 •

edited

Loading