其实与现代的情况已经类似文字转WAV音频