并且进行对比和推演文字转WAV音频