但是却可以大致估测出文字转WAV音频