也很难推算出一二文字转WAV音频