2017嘉義黑客松競賽簡報

mosdeo

2020/10/13 发布于 编程 分类

NLP  machine learning  AI  chatbot 

文字内容
1. 沒事多打1999 多打1999沒事? 陳情 x 派工 x 諮詢 單一 申 箱 市政信 路面 凹凸 不平 怎 麼辦 ? 訴系 統 2017/07/16《嘉義黑蚵松》 組別:交通觀光組 隊名:UXDDD User Experience Data Driven Design 隊員:方毅、呂銘洋、林高遠、卓易霆、郭浩傑
2. Define the problem 嘉義縣陳情管道: (1)網路 (2)書面 (3)縣長臉書留言 錢沒了!! 嘉市1999由市府總機接手 101年1月上路的嘉義市1999便民專線....因今年預算未通過,將於今日畫下句點。....開辦4 年多來累積近20萬件服務...以去年1月至今年2月,諮詢服務有2萬8,932件、派工處理案件 占1萬7,894件,陳情案件為6,909件....為了因應1999話務中心停止服務,市府各單位開發 的APP,....提供市民網路即時查詢資料及通報及陳情功能。 發佈日期:2016.3.31 單位:行政處/企劃處/警察局 https://www.chiayi.gov.tw/2015web/02_news/content.aspx?id=47448
3. Discuss and insight 臺北市政府人民陳情系統研究 (民國104年12月 單位:臺北市政府資訊局) 因管道多重,應避免民眾 一案多投 一般陳情內容未去識別化 ,致資料開放困難 人工分案效率低落,派工 系統轉介耗時耗力
4. Goals and Target 減輕市民專線1999或市 府總機人力負擔 陳情 x 派工 x 諮詢 資訊檢索 引導式FAQ協助問答 協助案件更快分類至正確單位
5. Solution 派工 利用APP陳情系統,減輕1999轉 接派工系統之負擔(初步可定義 數種屬於派工範疇的類別) 諮詢 如民眾不知該如何分類,可由問 題類別諮詢簡易詢問(由政府釋 放之語料配合機器學習擴充問 答能力) 陳情
6. Solution
7. Solution Machine Learning 常見問題爬蟲+餵資料學習 Further:未來如一般陳情案件去識別化後(並經得陳情人公開意願), 可使該機器學習更多語料,提高問題回答之正確率
8. Solution 語料 格式化 斷詞 Machine Learning 建立詞袋 (基底空間) 語料 向量化 各種模型 交叉測試 選出 最優
9. Solution Step 1:語料格式化 1259 條 Machine Learning
10. Solution Step 2:斷詞 Machine Learning 例: 身心 障礙者 醫療 費用 及 醫療 輔具 補助 如何 申請 ? 補助 項目 為何 ? 私有 空地 綠 美化 或作 為 公共 收費 停車 場 使用 , 地價稅 有何 優惠 或 補助 ?
11. Solution Step 3:建立基底 Machine Learning
12. Solution Machine Learning 原始句: 保險套破了怎麼辦?我會不會懷孕?有生育補助嗎? Step 4: 樣本向量化 斷詞: '保險套 破 了 怎麼辦 ? 我會 不會 懷孕 ? 有 生育 補 助 嗎 ?' 向量化: (0, 239) 0.608658302812 (0, 1074) 0.578851571963 (0, 1732) 0.47105755105 (0, 2162) 0.269389516597 ['保險套', '懷孕', '生育', '補助']
13. Solution Step 4: 樣本向量化 降至3維 示例 Machine Learning
14. Solution Step 5: 各種模型 交叉測試 Machine Learning 演算法 辨識率 TF + Bayes 0.94 (+/- 0.03) TF + LDA 0.89 (+/- 0.04) TF + kNN 0.78 (+/- 0.04) TFIDF + Bayes 0.95 (+/- 0.03) TFIDF + LDA 0.89 (+/- 0.03) TFIDF + kNN 0.87 (+/- 0.03)
15. Solution Map Board Geotag:標籤需處理問題的位置,使 空間概念能被簡易可視化 Layer、Timeline:用類別圖層、時間 軸搜尋,或已解決(未解決)等概念,適 當呈現地圖資訊(去除雜訊) Board:可針對別人的陳情問題按讚 或留言,加速民眾陳情速度與得知哪 些地方需改善情形較被為關注 Further:利用被關注情形(按讚數),做熱區圖(Heat map)以分析那些地點列 為優先派工/改善區域(如:路平專案優先規劃路段,預算優先編列)
16. DEMO TIME
23. thank you for your listening