被动式的质量探测文字转WAV音频