这个时候需要的是积累而不是破坏文字转WAV音频