所以此时台下的喧哗依然是可以理解的文字转WAV音频