所以这两种选择其实就是一种选择文字转WAV音频