他们不会去控制文字转WAV音频