开始每一层的排查文字转WAV音频