因为它只不过是用来追踪的文字转WAV音频