那就表明……他至少已经有了九成以上的把握文字转WAV音频