从他们身上所穿的服饰就可以看出文字转WAV音频