但我猜测他们的目的肯定不单纯文字转WAV音频