就是如何合情合理的让他们相信文字转WAV音频