估计也难以承受文字转WAV音频