在修士而言不太容易接受文字转WAV音频