我总认为写作是简单的文字转WAV音频