毕竟我们已经得到了画作文字转WAV音频