估计这会全部按照原先的布置文字转WAV音频