我的意思是你可以把坐标数据储备起来文字转WAV音频