基本上一开始就从剧本台词之中脱离文字转WAV音频