在场的差不多都是熟人文字转WAV音频