所以他们稍微想了想文字转WAV音频