所以今年的局面是文字转WAV音频