虽然他早就预料到了如此场景――因为当初他为了拍摄文字转WAV音频