因为这种可能性和复杂性文字转WAV音频