或许他们就是靠这个来确定消息的文字转WAV音频