根本不能以常理来揣度文字转WAV音频