同样包括他自己文字转WAV音频