不过更在意的是已经感知到位置的碎片文字转WAV音频