首先咱俩必须再次明确一下共识文字转WAV音频