有些是微观上的文字转WAV音频