前者是茶在杯中文字转WAV音频