可是根据他的观察文字转WAV音频