那就是通过我们之前所看到的建筑结构图文字转WAV音频