很显然第一种很容易就排除了文字转WAV音频