后者则需要更多的理解和经验才成文字转WAV音频