因为单从字迹文字转WAV音频