在 R 輸入 WebCam 影像並輸出播放視窗

最近剛好對 Rvision 這個可以連接 openCV 影像偵測函數庫的套件有興趣,但 Rvision 套件對於 WebCam 影像的擷取功能有限,而且 R 軟體上面目前也沒有專門處理相關影音的套件,於是我嘗試搭配 FFmpeg 軟體 (Windows 版),用 R 軟體的 pipe connection 功能來實驗一下在 R  操作影像輸入/輸出的功能
(繼續閱讀…)


 

Debian Linux (Wheezy) 上安裝 SparkR

最近想安裝 SparkR 來玩一下,結果 Google 搜尋來的資訊滿多都缺這缺那。舉例來說,這篇標題很好聽的「Install and Run SparkR – easy way」的文章教我們裝了一堆東西,結果整篇文章就是沒講要怎麼安裝 SparkR. 所以我就把自己的安裝過程寫下來給大家參考。

作業系統: Debian Linux 7.11 (代號 Wheezy), 應該也適用於 Ubuntu 14.04 版本
(繼續閱讀…)


 

比較 R 軟體 7 種不同的資料檔存取方法

最近在臉書的 「台灣R軟體Club」社團 中,Kang-Chung Yang 網友提到希望能用平行運算方式存/取大檔案以加快速度。熱心的陳慶全網友 Google 出可以使用 R 軟體內建的 readRDS/saveRDS 搭配 xz 或 pigz 兩個平行壓縮軟體來加快速度。

以下是我測試的結果,先講結論:

(1) 如果硬碟空間夠大:feather 套件的 read_feather 與 write_feather 速度最快,而且遠遠超過其他方法

(2) 如果硬碟空間有限:顧及存取速度、檔案大小、read/write 函數/資料檔格式的一致性,則 readRDS/saveRDS + pigz 是最適當的組合
(繼續閱讀…)


 

比較 save/load, saveRDS/readRDS, feather, 與 data.table 套件的讀寫速度

最近在一些實務資料計算過程中,會產生一些比較大的 data frame,程式中也會讀/寫好幾個句型的 data frame。光是這些讀/寫的動作就佔用頗多時間。

於是我上網找了幾個相似的 R 套件/函數,主要是 .Rdata (或 rda) 格式的 save/load, .rds 格式的 saveRDS/readRDS, 以及 feather 套件的 read_feather/write_feather,結果如下。

結論是,feather 套件對於 data frame 的讀入速度最快。

(繼續閱讀…)


 

一張圖比較 R vs. Python

我的汽車上曾經為了節省空間,放了一把萬能瑞士刀,想說上面有起子,臨時應急時比較方便。可是歷經一兩次真正需要轉好幾顆螺絲的狀況,後來我還是買了一根真正的十字起子放車上備用。

(繼續閱讀…)


 

Simple Linear Regression: R vs. Python

有時候聽到一些人在講 Python 比 R 「更適合」作資料分析或科學計算,我就覺得他們在胡說八道。

買 iPhone 人通常都被別人認為比較有品味,但如果把 iPhone 拿來當鐵鎚,固然能把釘子敲進去,但終究無法證明 iPhone 是適合當鐵鎚,更無法證明 iPhone 比鐵鎚更像鐵鎚。要敲釘子的話,還是拿鐵鎚來當工具比較適當,也比較直接容易。

在這裡,我們不使用 R 跟 Python 的 Regression package/module,純粹比較兩種程式語言「內建(built-in)」的數學與向量計算功能、從理論撰寫出程式的直覺跟簡潔、與程式碼的多寡,計算簡單線性迴歸 (Simple Linear Regression)

(繼續閱讀…)