然后在三人同时看过去的注视中文字转WAV音频