采取的是暗拍的形式文字转WAV音频