基本是没有可能看得到车内的情况的文字转WAV音频