更多的是要他自己领悟文字转WAV音频