那么实际上他们留在目标身边的人大概也就是2~3个文字转WAV音频