依靠的是外界的能量文字转WAV音频