所以这里的姿态问题要搞清楚文字转WAV音频