然后研究怎么在他们身上文字转WAV音频