他只能靠第二实验室的分析结果来推测文字转WAV音频