十几幅画只有三分之一是成品文字转WAV音频