这两类修士很好区分文字转WAV音频