AI模型文本分类方案,第3节,模型选择,中文分词、词向量、bert 如需文档和代码,请私信联系。 中文分词加词向量,通过计算某个词前后一定范围内的词的距离关系,找出经常出现在类似位置的词语关系。 bert是预训练自然语言模型,可以懂人话,动态理解上下文的含义,效果很好。但是bert有内容长度512的限制,无法直接处理长文本。 这里是关于长短文分类的具体方案,本方案参加了第七届西湖论剑比赛,得了优秀作品B等奖,奖金15000。