他选择的方法是在暗处观察我们文字转WAV音频