并将所有看到的文字都记录在脑海中文字转WAV音频