There seems to be a small error in the reported results: In most rows the model ...

coder543 · on Dec 6, 2023

That row says lower is better. For "word error rate", lower is definitely better.

But they also used Large-v3, which I have not ever seen outperform Large-v2 in even a single case. I have no idea why OpenAI even released Large-v3.

danielecook · on Dec 6, 2023

The text beside it says "Automatic speech recognition (based on word error rate, lower is better)"