并且从它们之间的相同点与不同点来分析它们共生的可能文字转WAV音频