而且他肯定是跟踪咱们过来的文字转WAV音频