而是要观察他文字转WAV音频