从而判断出了千夜的位置文字转WAV音频