或许前期就是根据这些设计的文字转WAV音频