现在的选角过程为了避免暗箱操作的出现文字转WAV音频