然后每家平均文字转WAV音频