一旦进入拍摄状态文字转WAV音频