如果他能够正确的认识自己文字转WAV音频