Skip to content

Jiangchenglin521/Classifier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

Classifier

一些说明:

  • 说明

自己之前在做东西的时候,有多分类的需求,但是在网上或者github上更多的是二分类源码。并且很多源码没有保存模型,测试和inference的代码,毕竟训练model是关键 为了打破这一瓶颈,个人将补全的完整代码上传到github上来,供大家参考。

  • 版本说明

此版本是一个基于双向lstm加乘性attention的一个分类model

  • Required environment

tensorflow1.x版本 python3.6

  • 其他说明
    • 此版本只有数据处理部分不是很完整,补充的位置里面有注释,因为根据每个人需求不同,文本不同,与处理方式也不同,大家自行添加就好了。加载词向量代码有保留,供参考。
    • 此版本分类效果针对微博情感数据的准确率个人已经训练到0.9+的效果,还是很靠谱的。
    • 修改成多分类版本的关键是1:要注意不管是text-cnn还是transformer等不是基于循环网络的结构修改原理是一致的,其实在训练时我们都是提取出最后的全连接层的输出,我们只需要将其映射到我们目标的class number就好,这是第一处改动。第二处就是我们要对label进行class num维度的one-hot转换,直接参与loss运算才不会报错。这里个人还建议大家可以使用label的embedding应该也可以,虽然意义貌似不大。
    • 如果大家有什么新的改进请与我沟通,如果有用,可以给我这个简单的project来个小星星✨嘿嘿。
  • 感谢

原始的部分代码借鉴自: jiangxinyang227/textClassifier,在此感谢此项目作者做出的贡献。

About

文本多分类完整代码,从训练到测试。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages