就是信任和等待文字转WAV音频