感觉它们的样子好像是在领悟文字转WAV音频