他需要消化和思考一下文字转WAV音频