所以为了证明他们的观点文字转WAV音频