因此在他们三人的认知中文字转WAV音频