不说这种理论是否真有依据文字转WAV音频