其实这个理论在古代已经有了一些大致轮廓文字转WAV音频