但主要是情节上的文字转WAV音频