确实还要差着一些文字转WAV音频