也就是说他们应对的更多是普通型的罪犯文字转WAV音频