他们猜到了自己可能在附近文字转WAV音频