距离下一层次的精微文字转WAV音频