他们能够做的就是等文字转WAV音频