第二阶段的结果已经见到文字转WAV音频