Skip to content
This repository has been archived by the owner on Nov 21, 2024. It is now read-only.

資料科學自動化 - Automation is all you need #16

Open
jazzwang opened this issue Jun 9, 2020 · 0 comments
Open

資料科學自動化 - Automation is all you need #16

jazzwang opened this issue Jun 9, 2020 · 0 comments
Labels
Data Science 資料科學與人工智慧 Data Science, Machine Learning & AI Developer 開發者 / Developer

Comments

@jazzwang
Copy link
Member

jazzwang commented Jun 9, 2020

  • 演講主題 Talk Topic: 資料科學自動化 - Automation is all you need
  • 講者姓名 Name: 劉俊廷
  • 單位名稱 Organization & Job Title: Cathay Data Science Lab Team / Data Scientist
  • 講者簡介 Self Introduction:

國泰金控 @ Data Science Lab Team, 資料科學家
autoML competition - lifelong machine learning, top7
autoDL competition - autoCV, top7

  • 講題摘要 Abstract:

自動化機器學習一直是近年來熱門話題之一。在企業界資料科學中,面對著兩大重要難題,一是模型自動化層面,其中原因就是優秀資料科學家非常珍貴,反之想要採用機器學習的部門越來越多,automl就是在供需不平等下所提出的解決方案。另一個難題是資料使用率,大企業每天記錄的資料流相當龐大,但是在人類領域知識限制下,資料科學家們會拿來分析並建立模型的部分總是佔非常低整體比例,也就浪費許多珍貴資料。

Cathay Data Science Lab Team 是國泰金控專門研究最先進機器學習及人工智慧的部門,針對兩大難題,由於現有開源軟體無法解決及有其限制,因此我們開發 Tumblebug 及 autoMLab 兩個 python 套件來處理。基於 Spark 分散式運算,Tumblebug 能針對使用者設定的預測目標,快速且自動從大量資料庫中萃取並處理成恰當的特徵提供後續使用。而 autoMLab 是一個基於 pyspark 基礎所構成 automl 套件,幫助公司內部其他部門在使用分散式機器學習時更加快速穩定。此次會說明如何利用這兩個自行開發的套件,解決國泰內部大量需求ML案例。

最後我們實驗室有針對 Automation Deep Learning, Neural Architecture Search 進行研究開發,並且發表相關論文,來面對未來後續更多樣自動化深度學習任務。

@jazzwang jazzwang added Data Science 資料科學與人工智慧 Data Science, Machine Learning & AI Developer 開發者 / Developer labels Jun 9, 2020
Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
Data Science 資料科學與人工智慧 Data Science, Machine Learning & AI Developer 開發者 / Developer
Projects
None yet
Development

No branches or pull requests

1 participant