顶多能够判断出对方很强大文字转WAV音频