其实也就是个身份切换和接受文字转WAV音频