他必须要弥补文字转WAV音频