虽然在操控方面还无法做到细致入微文字转WAV音频