顶多只能算是互相利用文字转WAV音频