也因为繁杂程度分为低级中级和高级文字转WAV音频