那之后整个阶段的拍摄就很少会遇到ng了文字转WAV音频