让导演从这繁杂而冗长的素材中拣选出一条清晰的故事线文字转WAV音频