所以画面中要有不同肤色的模特文字转WAV音频