但是这里里面唯一不同的是主要采文字转WAV音频