主要是依靠上面的符文文字转WAV音频