毕竟按照历史文字转WAV音频