以第一人称的主视角推进剧情文字转WAV音频