不得不采用这个理论的研究成果文字转WAV音频