到现在算上正在拍摄的文字转WAV音频