会随着分身的数量而增加文字转WAV音频