恐怕也正是它无法控制文字转WAV音频