这两种方法最后的结果是相同的文字转WAV音频