也许拍摄过的过程中会有些麻烦文字转WAV音频