大约就是仪器用熟了文字转WAV音频