不过他们说他们应该能控制文字转WAV音频