和期待值相比文字转WAV音频