然后到第三个人时文字转WAV音频