如果单单从身份和位置上面来说文字转WAV音频