因为它还需要厂商对其进行二次开发文字转WAV音频