最多的便是瞳类和爪类文字转WAV音频