- 说明
自己之前在做东西的时候,有多分类的需求,但是在网上或者github上更多的是二分类源码。并且很多源码没有保存模型,测试和inference的代码,毕竟训练model是关键 为了打破这一瓶颈,个人将补全的完整代码上传到github上来,供大家参考。
- 版本说明
此版本是一个基于双向lstm加乘性attention的一个分类model
- Required environment
tensorflow1.x版本 python3.6
- 其他说明
- 此版本只有数据处理部分不是很完整,补充的位置里面有注释,因为根据每个人需求不同,文本不同,与处理方式也不同,大家自行添加就好了。加载词向量代码有保留,供参考。
- 此版本分类效果针对微博情感数据的准确率个人已经训练到0.9+的效果,还是很靠谱的。
- 修改成多分类版本的关键是1:要注意不管是text-cnn还是transformer等不是基于循环网络的结构修改原理是一致的,其实在训练时我们都是提取出最后的全连接层的输出,我们只需要将其映射到我们目标的class number就好,这是第一处改动。第二处就是我们要对label进行class num维度的one-hot转换,直接参与loss运算才不会报错。这里个人还建议大家可以使用label的embedding应该也可以,虽然意义貌似不大。
- 如果大家有什么新的改进请与我沟通,如果有用,可以给我这个简单的project来个小星星✨嘿嘿。
- 感谢
原始的部分代码借鉴自: jiangxinyang227/textClassifier,在此感谢此项目作者做出的贡献。