所以他们更看重的是天赋文字转WAV音频