都是三个顾客出的文字转WAV音频