所以他听每一个人的话都是听的非常仔细文字转WAV音频