在初期的时候能够测得很准文字转WAV音频