还真的会忽略文字转WAV音频