第三屆泰迪杯技能賽賽後分享總結

第三屆泰迪杯技能賽賽後分享總結

  今天泰迪杯官方公佈了第三屆泰迪杯技能賽的獲獎狀況,個人小組A題得到了二等獎,B題得到了一等獎。做爲第一次參加這個比賽的小白,仍是感到比較幸運的。下面就來複盤一下此次的比賽和分享一下作題經歷。python

對本次競賽的一些見解

  經過此次的比賽,我感受參賽方主要考察的是你們利用各類工具解決問題的能力,畢竟一道題目的時間限制爲12個小時,你們沒必要把問題太過複雜化,感受本身用Excel解決這個問題更順手就用Excel,用python畫圖簡單就用python,主要是能在規定時間內獲得一個較好的答案,不管哪一步均可以作的比較簡單,包括最後的提交報告,雖然是很是重要的一環,可是不用寫的過於複雜,主要是表達清晰,能夠看作是一個很簡化的數學建模論文。
  泰迪杯技能賽分爲A,B兩道題目。由於競賽的頒獎是按照報名人數的比例頒獎,因此建議參賽的同窗也最好把兩道題都作了,這樣獲獎機率會大不少。
  今年的A題難度明顯要高於B題,咱們組在作A題的時候也遇到了不少的困難,尤爲是任務3須要用到一些特定的算法,因爲種種緣由,到晚上7點(8點截止)咱們也沒有獲得一個比較好的結果,因爲對時間的把控失誤,最後剩給咱們寫報告和整理支撐材料的時間只剩下了40分鐘。着急提交了論文以後以爲獲獎無望,因而咱們毅然決定在次日繼續作B題。最後很幸運兩道題目均有獲獎。

算法

B題覆盤

  因爲當時作A題的時候草草結尾,時間過去一個多月,不少記憶和比賽資料也都丟失了,這裏就只能給你們覆盤一下B題。
  B題的背景是當下世界最關心的話題:新冠疫情。簡單分析題目以後解題重點就尤其突出:處理數據、可視化
  固然這也正是這類比賽的考察重點。大多數這類比賽的前期數據處理都較爲複雜,此次競賽的A題也是如此,可是此次的B題不同,隊友利用pandas對數據進行清洗查看後,發現數據並沒有異常,惟有在「A 市涉疫場所」表中出現一行重複數據,猜想是由於在同一天的同一地點報告了兩例病例,故 視爲正常數據。所以,咱們直接着手對數據進行分析和處理。任務1.1-1.3偏向於一個定解問題,利用python中的group by函數能夠進行處理,其中任務1.3須要對該日住院人數進行定義,而後將問題的結果作成表格展現在報告中。
  任務1.4有一個須要注意的點在於:第六天具備傳播性且未被收治的感染者,應爲第七天和八天被通報的確診者,第十天具備傳播性且未被收治的感染者,應爲第十一天和十二天被通報的確診者。只要理解了這個點,剩下的就很簡單了,把對應的確診者的座標找到,而後做圖畫出,這裏做圖仍是儘可能以簡潔美觀爲要點。下面展現第十天疫情傳播風險區域圖:
在這裏插入圖片描述
  到這裏任務1就圓滿解決了,你們能夠看出任務1的解決是相對簡單的,我認爲任務1要點就是完成度要高,結果展現清晰,分析合理。
  對於任務2,這裏就不得不提到競賽方提供的一個能夠用於可視化大屏製做的BI平臺。咱們小組的任務2就是在第一題處理的數據基礎上,徹底依賴於BI平臺製做的可視化大屏。(競賽方的意思是可使用任何軟件工具,可是他都已經提供了這麼一個平臺,我大膽猜想固然是用這個比較好)
  製做可視化大屏的基本框架是來源於賽前培訓的汽車銷售大屏。內容方面是參考丁香醫生的表達內容。在這裏插入圖片描述
在這裏插入圖片描述
  相關的分析也就是徹底照着可視化大屏的內容,有什麼說什麼。
  任務3就相對比較開放,須要對疫情發展階段進行劃分,爲了對世界不一樣地區在不一樣階段的標誌參數的特色進行分析,咱們定義了新冠疫情標誌性參數:
在這裏插入圖片描述
  後面的工做就是根據這些指標,進行數據的處理,數據的可視化,而後根據可視化結果進行簡單分析。下面是在Jupyter Notebook 上作的圖:
在這裏插入圖片描述
在這裏插入圖片描述













框架

關於報告寫做

  報告的寫做必定是很重要的一點,由於不管你過程作的多好,評委也只能看到你提交的報告,因此真正決定你獲獎高低的必定是最後報告中體現的內容。
  報告必定要從比賽一開始就着手去寫,和數學建模比賽同樣,能夠有一個同窗專門負責記錄整理你們的思路和撰寫報告,報告不須要太複雜,我認爲報告必定是在能完整表達出本身的結果和內容的基礎上,以清晰簡潔爲重。下面是咱們組報告的目錄:在這裏插入圖片描述
  問題重述、任務假設、任務解決三點足矣表達清楚整個解題流程和思想。
  最重要的部分可能就在於數據可視化,俗話說一圖勝千文,其實咱們組的可視化部分也不是特別精美,還有不少值得改進的地方,你們在寫報告的時候多多插入能表達結果或思考內容的表格、可視化圖片或是流程圖,對於整個報告的質量提高仍是會有很大幫助的。


函數

我的心得與題外話

  我的認爲這個比賽有好的地方:某種程度上比數學建模的強度更大,由於要在12個小時內完成全部工做,但它的題目仍是相對簡單的,獲獎比例也較高,相信各位不管是新手仍是大佬,只要作好準備,和隊友努力做戰兩天,應該仍是能夠得到好成績,固然最主要的是能夠獲得鍛鍊。
  很差的地方也有:主辦方提供的數據不必定符合常理;競賽官網常常拉閘,連續三屆比賽提交題目的時候官網都很卡,主辦方也所以一再延長提交時間,你們要對突發狀況多點耐心;提供的建模平臺和BI平臺bug也有不少,咱們組的A題就是由於建模平臺給搞砸了,但B題又由於BI平臺而出彩,但不管怎樣,若是想獲獎,你們仍是多多去學習一下賽前培訓。
  不出意外的話,會有看到這篇文章的小夥伴會來找我要原始報告看看,其實我已經把報告中大部分展現的內容在B題覆盤中展現了,並且這個競賽的報告相對簡單,你們仍是要突出本身的元素。這裏就提早狠心拒絕了。
  距離比賽結束也有一個月了,可能博客中有的地方表達不清晰或者有錯誤,歡迎指正。最後祝你們下次比賽取得理想成績!


工具

相關文章
相關標籤/搜索