所以过程也就是错的文字转WAV音频