2016年8月17日

使用R進行簡易的影像比對-以蝴蝶斑點為例

接到了一個支線任務,簡單來說,學生的科展題目為蝴蝶翅膀斑點的影像辨識。將蝴蝶左翅膀腹側的照片轉正,翅寬為圖寬,翅長為圖長,切成約略正方形的圖片。

在圖片上放上15X15的方格,以人工的方式判斷該格子內是否有蝴蝶斑蚊,若有則為1,若無則為0。依此建立該種蝴蝶的模式矩陣。

同種蝴蝶可以建立多個模式矩陣,並以多數決的方式決定矩陣內為有斑點或無斑點,在學生過去的科展中,同種蝴蝶取十張照片。

多種蝴蝶均建立好模式矩陣後,待測蝴蝶照片依樣正規化處理建立斑點的01矩陣,並與模式矩陣比較,看誰的差異較少(漢明距離),差異最少者及比對成該種蝴蝶。

2016年8月9日

R data mining 練習 - Mobile01 的單車討論版

剛剛看到2012年R 與自行車(單車熱已退!?)這篇文章,透過R抓取討論區的文章,分析其發文年份,用來估算台灣的單車熱潮,因此也跟著練習了一下資料挖礦和正規表示法的使用。在程式還在跑的時候(503頁,每頁格1秒)想說來紀錄一下語法,也看一下2012~2016年單車熱是否有所變化。

2016年8月8日

常用統計檢驗法簡介


大學時有修過生物統計,我自認是非常認真的學生,前前後後總共讀完幾本原文書,幾本中文磚塊書,我寫這篇文章的理由是,雖然在唸完書的當下覺得好像清楚多,但在研究生面對自己的研究數據時,腦袋還是一片空白,根本不知道要進行何種統計分析與檢驗。而且中文統計名詞複雜且多樣,根本不知道是對應哪個英文,有些檢驗其實還有許多細節,上課根本沒有提到(比如說T.test 分成三種)。
本文會簡介常用的幾種檢驗法與相關 Excel, R 的語法,並舉例該檢驗是在檢驗何種數據。