你所说的可能性是存在的文字转WAV音频