都是一强一弱靠得比较近文字转WAV音频