总是会找到各自位置的文字转WAV音频