毕竟在拍摄过程中很难瞻前顾后文字转WAV音频