只是这个时候根本分辨不清哪里是哪里文字转WAV音频