其实是有无数个小网组合而成文字转WAV音频