虽然只有极其简单的理论文字转WAV音频