PyHubWeekly每周定期更新,精选GitHub上优质的Python项目/小工具。
我把PyHubWeekly托管到了Github,感兴趣的可以搜索Github项目PyHubWeekly,如果喜欢,麻烦给个Star支持一下吧。此外,欢迎大家通过提交issue来投稿和推荐自己的项目~
本期为大家推荐GitHub上5个优质的Python项目,它们分别是:
- dlaicourse
- pysheeet
- table-ocr
- posthog
- RL-Stock
下面分别来介绍一下上述5个GitHub项目。
Star:2.8k
如果说这两年比较火热的研究方向是什么?深度学习肯定能够占据一席之地。
由于人工智能的火热,各种行业的同学都在尝试着去学习深度学习。可是,该怎么学习却成了让很多人困扰的问题。
虽然免费学习资源数不胜数,但是,要么偏重理论而脱离实践,要么一味的重视实践却没有理论,让人看的云里雾里。
dlaicourse是这些中我认为较为不错的一个学习深度学习github项目。
dlaicourse不仅包含了深度学习基础知识部分,这个项目还有练习、应用等方面的内容。
更重要的是,这个项目使用jupyter notebook开发,理论部分与实践部分紧密相结合,在介绍理论知识的过程中让你直观的看到它是如何实现的,我想,这才是对于学习深度学习的同学比较友好的一种教学方式。
Star:5.9k
pysheeet即为Python Cheat Sheet,一个用于收集Python有价值片段,增强Python编码体验的项目。
我认为在学习一样知识时,会用与精通之间往往会有一个瓶颈。例如,一个学习歌唱的同学,总认为自己的发声是最为恰当的,但是,如果有一个有经验的教授给予指点,找到明确的方向,这时候会发生突飞猛进的变化。
编码也是,当我们学完Python并且在项目中用过很长一段时间之后,我们会陷入一个固定思维,认为当下编码的习惯就是理所当然的,就是恰到好处的,但是,也许在使用方式、编码风格等方面已经走错了方向。
pysheeet这个项目就收集了很多有有价值的Python片段,其他包括但不限于,
- 代码样式
- 列表
- 字典
- 正则表达式
- 异步
- 测试
- ...
这个项目在每个方向均给出了正反例,告诉你什么样才是一个规范的编码方式。
Star:119
table-ocr是一个运用unet实现对文档表格的自动检测,表格重建的OCR项目。
OCR工具是目前比较受欢迎,且提高很多工作效率的一类工具。
它背后到底是如何实现的?
table-ocr这个项目可以帮你揭开它神秘的面纱。
另外,使用过OCR工具的同学应该都清楚,OCR在印刷体文字识别过程中效果越来越好,但是在表格方面一直捉襟见肘。table-ocr就针对表格检测进行设计和优化,在表格识别、重建效果方面非常突出。
Star:1.9k
posthog是一款开源的网站统计工具。
PostHog是为开发人员构建的开源产品分析工具,它能够自动收集网站或应用程序上的每个事件,无需向第三方发送数据。只需单击一下就可以部署到自己的基础设施上,并且可以对底层数据进行完整的API/SQL访问。
它具有如下特性,
- 基于事件的用户级分析-查看哪些用户正在你的应用程序中执行什么操作
- 自动捕获点击和页面浏览量,以分析用户的追溯操作
- 支持JS、Python、Ruby、Node、Go+API的库
- 简单的部署方式
Star:1.2k
RL-Stock是一款利用强化学习自动炒股的Python项目。
提到机器学习、人工智能在金融、炒股等方面的应用,更多的人会想到预测,例如,传统机器学习、LSTM等。
而强化学习作为机器学习的一个分支,它的模型更符合一个人做决策的过程,也更加贴近现实世界的场景。与监督学习预测未来的数值不同,强化学习根据输入的状态(如当日开盘价、收盘价等),输出系列动作(例如:买进、持有、卖出),使得最后的收益最大化,实现自动交易。
作者利用强化学习对炒股过程进行了建模,实现了自动炒股。
话说回来,炒股需谨慎,这个项目可以作为一个学习强化学习同时了解股票知识的一个小工具。我想,利用将强化学习应用于股市,应该早已经有很多公司考虑到这一点,但是,它所带来的收益和风险是并重的,我想这也是为什么很少有公司大规模将人工智能,尤其深度学习应用于金融领域的原因。