应该是存在某种几率的文字转WAV音频