可以针对局部的空间文字转WAV音频