其实也就是同源的流墨墨和琴瑟色能感知得出来文字转WAV音频