三方各自保留一份文字转WAV音频