这是一个相对保守的阵型文字转WAV音频