目标是锁定了前三的文字转WAV音频