但是第一方案也不能放弃文字转WAV音频