应该有一个统一的首领文字转WAV音频