本身便是随意安排的房间文字转WAV音频