甚至站到镜头之前才能感受得到文字转WAV音频