两个小家伙配合等待的样子就可以看得出文字转WAV音频