他也不知道自己应该如何组织语言文字转WAV音频