只是在尽力将自己的状态调整在最佳文字转WAV音频