这是通过一颗去感应另外一颗的存在文字转WAV音频