其实是有一定光线的文字转WAV音频