• Stars
    star
    2
  • Language
    HTML
  • Created over 5 years ago
  • Updated about 4 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

台灣政府開放資料平台擁有龐大的資料,可以被各領域應用。但很多資料品質不佳,有一些小問題,造成使用上不是這麼方便。像是編碼格式不一、重複變數名稱、資料第一行第二行包含無意義資訊,一整行或列全部NA等,雖然人工來說,不難處理,但每次利用時,都有類似的問題,造成使用者不便或觀感不佳,因此建立自動清理程式,完善大部分資料的小問題。 政府開放資料平台上,很多資料集標籤有誤,因此透過文字分類建模,創造貼標籤模型,期望能改善政府開放資料的各項品質。