看样子是要放在第二阶段文字转WAV音频