我觉得我们应该效仿古籍文字转WAV音频