我的领域则偏向于防御文字转WAV音频