基本上各自占了一半文字转WAV音频