更多的还是多次彩排后用自己满意的表演模式拍摄文字转WAV音频