而我们则在后面追逐文字转WAV音频