大部分都是些家境一般的市民文字转WAV音频