毕竟人家的目标是他文字转WAV音频