确实应该从两年前说起――在当时文字转WAV音频