根本就是不同文字转WAV音频