也不完全是被控制文字转WAV音频