既然在数量上没办法比文字转WAV音频