因为他们都已经确定了身份文字转WAV音频