不过这两个分析完全是两个极端文字转WAV音频