虽然这个结果他有可能猜到文字转WAV音频