通过一系列复杂的身份识别手续文字转WAV音频