第二种和第三种猜测的可能性更大文字转WAV音频