很显然他也是认识到自己的说话文字转WAV音频