他们的主要目的就是跟踪容冶文字转WAV音频