因为是理论性的东西文字转WAV音频