与其说是所谓的尝试或者直觉文字转WAV音频