但那是双方数字相差不大的情况下文字转WAV音频