然后再慢慢分析自己挪动一步文字转WAV音频