这种理论表示文字转WAV音频