所以现在在拍摄的同时文字转WAV音频