主要是为了稍微的束缚一下文字转WAV音频