而且自己观察了他的说话文字转WAV音频