只是这种设备的运算量过大文字转WAV音频