也许因为法则的不同文字转WAV音频