但整体故事架构还是一样的文字转WAV音频