得出的结论也是相差无几文字转WAV音频