并指认大家的位置文字转WAV音频