虽然他们的手段可能没有那么单纯文字转WAV音频