这三张图是在三个不同时段扫描出来的文字转WAV音频