但他们似乎知道文字转WAV音频