这种情况下很难组织文字转WAV音频