根本用不着考虑文字转WAV音频