就是长期同化文字转WAV音频