主要是试镜写完了文字转WAV音频