当然在我们的分析中它们可能比不上文字转WAV音频