他接受的训练告诉他文字转WAV音频