并根据这些支离破碎文字转WAV音频