那么第二个阶段就会自然出现文字转WAV音频