而他们所见到的不过是人装扮的文字转WAV音频