更注重的是持续文字转WAV音频