是自己灌输进去的文字转WAV音频