其基本组成部分为坞口文字转WAV音频