这点确实不能不考虑文字转WAV音频