肯定不会选择前者文字转WAV音频