而是按照他们的天赋文字转WAV音频