根本没办法进一步的去猜测文字转WAV音频