我们确实需要给自己弄一个明面上的身份文字转WAV音频