就是要在二等学徒的基础上文字转WAV音频