然后他又加重了自己的语气文字转WAV音频