Skip to content

Commit

Permalink
update
Browse files Browse the repository at this point in the history
  • Loading branch information
imhuay committed Aug 31, 2018
1 parent ca6bcef commit 9b445b1
Show file tree
Hide file tree
Showing 6 changed files with 100 additions and 10 deletions.
4 changes: 2 additions & 2 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -21,13 +21,13 @@
- [《深度学习》整理](./机器学习-深度学习-NLP/DL-《深度学习》整理.md)
- [专题-CNN](./机器学习-深度学习-NLP/DL-B-专题-CNN.md)
- [专题-RNN](./机器学习-深度学习-NLP/DL-B-专题-RNN.md)
- [序列建模](./机器学习-深度学习-NLP/DL-C-专题-序列建模.md)
- [专题-序列建模](./机器学习-深度学习-NLP/DL-C-专题-序列建模.md)
- 机器学习
- [机器学习算法](./机器学习-深度学习-NLP/ML-机器学习算法.md)
- [机器学习实践](./机器学习-深度学习-NLP/ML-机器学习实践.md)
- 自然语言处理
- [NLP 基础](./机器学习-深度学习-NLP/NLP-A-自然语言处理基础.md)
- [词向量](./机器学习-深度学习-NLP/NLP-B-专题-词向量.md)
- [专题-词向量](./机器学习-深度学习-NLP/NLP-B-专题-词向量.md)
- [Word2Vec](./机器学习-深度学习-NLP/NLP-B-专题-词向量.md#word2vec)
- [GloVe](./机器学习-深度学习-NLP/NLP-B-专题-词向量.md#glove)
- [FastText](./机器学习-深度学习-NLP/NLP-B-专题-词向量.md#fasttext)
Expand Down
20 changes: 18 additions & 2 deletions ToDo.md
Original file line number Diff line number Diff line change
Expand Up @@ -18,6 +18,7 @@ Updates Log
- 缺失值
- 特征工程,特征选择的标志(为什么选择这些特征)
- XGB 调参的方法、LightGBM、CatBoost
- gbdt,xgboost,lgbm的区别
- 模型融合的方法
- 数据可视化分析 - 流形学习
- NLP-句向量
Expand All @@ -39,10 +40,26 @@ Updates Log
- HR面常见问题
- 超参数调优
- 机器学习实战-部分代码(K-Means等)
- 二叉树最长路径
- 判断相似二叉树及优化
- `max(x, y)` 的期望


## 2018-8-31
- 数据结构 - 字符串 - 中缀表达式转后缀表达式(逆波兰式)
- 数据结构 - 二叉树 - 最大路径和
- 深度学习 - 基础 - 批量归一化(BN)

## 2018-8-30
- 算法 - 海量数据处理专题 - 判断一个数是否在 40 亿个数中出现
- 笔试面经 - 招行 - 推倒吧骨牌

## 2018-8-29
- DL-专题-RNN
- RNN 的 3 种设计模式
- DL-专题-序列建模
- Seq2Seq
- Beam Search

## 2018-8-28
- 完善 K-Means 注释
- 算法-随机数
Expand All @@ -54,7 +71,6 @@ Updates Log
- K-Means
- 360 笔试
- 算法-数据结构
-

## 2018-8-26
- 深度学习基础
Expand Down
19 changes: 17 additions & 2 deletions papers/Attention机制/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -7,13 +7,28 @@ Index

- [[2017].Attention_is_All_You_Need](#2017attention_is_all_you_need)
- [[2017].A_Structured_Self-attentive_Sentence_Embedding](#2017a_structured_self-attentive_sentence_embedding)
- [[2018].Densely_Connected_CNN_with_Multiscale_Feature_Attention](#2018densely_connected_cnn_with_multiscale_feature_attention)
- [[2018].Next_Item_Recommendation_with_Self-Attention](#2018next_item_recommendation_with_self-attention)

<!-- /TOC -->

## [2017].Attention_is_All_You_Need

- 谷歌大脑出品,很有名的一篇文章

## [2017].A_Structured_Self-attentive_Sentence_Embedding
- [[2017].Attention_is_All_You_Need](#2017attention_is_all_you_need) 中引用了本文
- 本文使用 Self-Attention 学习**任务无关**的 Sentence Embedding
> 我曾在搜狗的面试中被问到“知道哪些方法可以学习任务无关的句向量吗?”
> 我曾在搜狗的面试中被问到“知道哪些方法可以学习任务无关的句向量吗?”
## [2018].Densely_Connected_CNN_with_Multiscale_Feature_Attention
- PaperWeekly 周推荐 > https://www.paperweekly.site/papers/2240
- 源码:https://github.com/wangshy31/Densely-Connected-CNN-with-Multiscale-Feature-Attention

- 本文是清华大学发表于 IJCAI 2018 的工作。针对文本分类任务中卷积神经网络通常无法灵活学习可变 n 元特征(n-gram)的问题,论文提出了一种具有**适应式注意力机制****密集连接的卷积神经网络**。该模型通过建立底层特征和高层特征之间的**跨层连接**,从而获得了丰富的**多尺度特征**,而注意力模型能够**自适应地选择合适尺度的特征**以适用于各种不同的文本分类问题。该法面向六个公开数据集均实现了超过基线的预测精度。

## [2018].Next_Item_Recommendation_with_Self-Attention
- PaperWeekly 周推荐 > https://www.paperweekly.site/papers/2246

- 本文提出了一种基于 self-attention 的基于序列的**推荐算法**,该算法是用 self-attention 从用户的**交互记录**中自己的去学习用户**近期的兴趣**,同时该模型也保留了用户**长久的兴趣**。整个网络是在 **metric learning** 的框架下,是第一次将 self-attention 和 metric learning 的结合的尝试。

- 实验结果表明,通过 self-attention,模型可以很好的学习用户的短期兴趣爱好,并且能有效的提升模型效果。通过和近期的文章得对比发现,该方法可以在很大程度上改善**序列化推荐**的效果。
Binary file not shown.
59 changes: 59 additions & 0 deletions 招聘要求.md
Original file line number Diff line number Diff line change
Expand Up @@ -3,6 +3,9 @@
<!-- TOC -->

- [机器学习/AI/算法](#机器学习ai算法)
- [网易游戏-智能运维算法工程师](#网易游戏-智能运维算法工程师)
- [远景-算法工程师-最优化/深度学习(上海)](#远景-算法工程师-最优化深度学习上海)
- [图森未来-深度学习框架研发工程师(2019校园招聘)](#图森未来-深度学习框架研发工程师2019校园招聘)
- [小红书-机器学习算法工程师(2019校招)](#小红书-机器学习算法工程师2019校招)
- [迅雷-人工智能工程师](#迅雷-人工智能工程师)
- [京东-算法工程师](#京东-算法工程师)
Expand All @@ -25,6 +28,62 @@

# 机器学习/AI/算法

## 网易游戏-智能运维算法工程师

**您可以**
```
- 面对海量数据,设计和实现智能运维所需的策略和算法;
- 关注相关方向的前沿研究,并将相关成果工程化落地到智能运维平台。
```

**我们希望你具备以下条件**
```
- 在数学、计算机、机器学习等领域有本科以上学位;
- 对数据敏感,熟悉各类数据分析和预测算法、机器学习算法,并精通其中至少一类;
- 熟练掌握至少一种常用编程语言,如Python、R、Java、Go等,具有算法工程化能力;
- 拥有持续学习的欲望和能力,对应用数据算法解决现实业务问题具有热情;
- 在机器学习、数据分析、预测方面具有实际项目经历优先。
```

## 远景-算法工程师-最优化/深度学习(上海)
> [远景2019校园招聘](http://recruit.envisioncn.com/jobList.html?goType=EnvisioncnDigital)
**工作内容**
```
采用人工智能技术,将新能源开发过程中的设计过程算法化,
如风险特征提取、资源规划、物流规划、电器设计、结构设计等。设计算法,向软件团队交付模型。
```
**职位要求**
```
1、计算机或软件工程专业硕士及以上学历;
2、扎实的数理建模基础、抽象思维和快速学习能力,数学、运筹学、计算机、自动化专业优先;
3、熟悉组合优化的经典算法和问题,理解原理,熟悉和掌握智能优化算法,如进化、模拟退火等;
4、掌握一种以上常用深度学习框架,如tensorflow、keras、torch,熟悉卷积神经网络类的原理,理解指针网络的原理;
5、熟练掌握C++、Python。
```

## 图森未来-深度学习框架研发工程师(2019校园招聘)
> [北京图森未来科技有限公司](https://app.mokahr.com/campus_apply/tusenweilai#/job/687ec29b-5dd6-4cc8-80bb-a79a1337b884?_k=urfwgl) - 校园招聘
**职位描述**
```
岗位职责:
针对公司内部需求,优化深度学习平台(MXNet)训练和部署性能;
基于MXNet,设计和研发大规模分布式训练平台;
为相关开源项目贡献新Feature。
```

**任职要求**
```
了解机器学习以及深度学习基本知识;熟悉计算机体系结构和性能优化基本知识;
在相关开源项目(MXNet,Caffe,TensorFlow,PyTorch)有贡献者优先。
```

**加分项**
```
有并行分布式开发经验或ACMICPC/超算比赛等参赛经验。
```

## 小红书-机器学习算法工程师(2019校招)
> 小红书校园招聘 https://campus.xiaohongshu.com/jobs/310177699
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -38,7 +38,7 @@ Index
- [编辑距离](#编辑距离)
- [最长公共子序列(LCS)](#最长公共子序列lcs)
- [最长公共子串](#最长公共子串)
- [最长递增/上升子序列(LIS)](#最长递增上升子序列lis)
- [最长递增子序列(LIS)](#最长递增子序列lis)
- [最长回文子序列](#最长回文子序列)
- [最长回文子串](#最长回文子串)
- [最大连续子序列和](#最大连续子序列和)
Expand Down Expand Up @@ -775,7 +775,7 @@ int main() {
```
## 最长递增/上升子序列(LIS)
## 最长递增子序列(LIS)
> [最长递增子序列](https://www.nowcoder.com/questionTerminal/585d46a1447b4064b749f08c2ab9ce66)_牛客网
>
> [最长上升子序列](https://leetcode-cn.com/problems/longest-increasing-subsequence/description/) - LeetCode
Expand Down Expand Up @@ -892,8 +892,8 @@ int main() {
vector<int> dp;

for (int j = 0; j < n; j++) {
// 这里用 lower_bound 也可以
auto it = upper_bound(dp.begin(), dp.end(), nums[j]);
// 这里用 upper_bound 也可以
auto it = lower_bound(dp.begin(), dp.end(), nums[j]);
if (it == dp.end())
dp.push_back(nums[j]);
else
Expand Down

0 comments on commit 9b445b1

Please sign in to comment.