他现在用的是后者文字转WAV音频