只需要在收集最后的几枚文字转WAV音频