就是从眼前的这位身上得来的文字转WAV音频