文件名称:EHC幽默识别英文模型
文件大小:362.38MB
文件格式:ZIP
更新时间:2022-07-02 21:47:38
EHC nlp 幽默识别 神经网络 预训练模型
这是训练好的EHC幽默识别英文模型,具体使用请参考我的博客。 任务介绍 本次评测选取了两部不同语种的情景喜剧(英文为《老友记》,中文为《我爱我家)作为数据来源。根据场景和剧情的变化,情景喜剧被划分成若干段对话(Dialogue),在一段对话中,存在不同角色进行交流,产生连续的对白(Utterance)。同一段对话中的对白按顺序出现,存在上下文关系。相比于单句幽默,对话中的幽默可能来自于上下文语境,而非对白内容本身。因此,参赛者需要结合上下文语境内容对对白是否幽默作出判断,识别出情景喜剧中的笑点。 数据介绍 本次评测任务的数据涉及两种语言:英文数据来自情景喜剧《老友记》,中文数据来自情景喜剧《我爱我家》。任务根据场景变换将情景剧的对话结构分为Dialogue和Utterance两个层级,其中一个Dialogue包含若干个有序出现的Utterance。
【文件预览】:
en_model
----tokenizer_config.json(452B)
----special_tokens_map.json(112B)
----sample_input.pkl(7KB)
----vocab.txt(107KB)
----pytorch_model.bin(390.21MB)
----gitattributes(1KB)
----tokenizer.json(263KB)
----README.md(25B)
----config.json(1KB)