也就是三处特殊的位置文字转WAV音频