反而是直接从他们身旁掠过就可以判定文字转WAV音频