但该走的流程还是要走文字转WAV音频