Simple Linear Regression: R vs. Python

有時候聽到一些人在講 Python 比 R 「更適合」作資料分析或科學計算,我就覺得他們在胡說八道。

買 iPhone 人通常都被別人認為比較有品味,但如果把 iPhone 拿來當鐵鎚,固然能把釘子敲進去,但終究無法證明 iPhone 是適合當鐵鎚,更無法證明 iPhone 比鐵鎚更像鐵鎚。要敲釘子的話,還是拿鐵鎚來當工具比較適當,也比較直接容易。

在這裡,我們不使用 R 跟 Python 的 Regression package/module,純粹比較兩種程式語言「內建(built-in)」的數學與向量計算功能、從理論撰寫出程式的直覺跟簡潔、與程式碼的多寡,計算簡單線性迴歸 (Simple Linear Regression)

(繼續閱讀…)


 

Debian Linux Wheezy 安裝 GTX 1080 GPU 顯示卡 + R 軟體

Linux 核心資訊:Linux debian64 3.2.0-4-amd64

昨天買的 GTX 1080 Turbo OC 8G 顯示卡寄來,於是把之前那張便宜的 GeForce 210 顯示卡換掉,重新開機後進入 R,本來以為之前已經裝好了 Navidia CUDA Toolkit 跟 gpuR, gputools , 結果紛紛出現錯誤訊息,無法執行

於是上網搜尋看看別人在相同的作業系統下安裝 GTX 1080 的經驗,沒想到沒有人裝過

(繼續閱讀…)


 

R 軟體: xgboost + iris 資料範例

最近在 Kaggle 網站很紅的 xgboost 分類技術,在網路上居然找不到簡單易懂的 R + xgboost + iris 資料檔的範例

多數的人提供的範例都寫得亂七八糟、慘不忍睹,需要再額外花不少時間去理解跟改寫。我常常覺得不少 IT 背景的人在寫 document 或做範例時,經常把簡單的東西搞得非常複雜,大概是認為只要他們自己看得懂即可

所以我整理了以下這個例子,有興趣的朋友們可以 copy 去使用

(繼續閱讀…)


 

終於把書寫完了

構思了一陣子,幾個月的撰寫,最近終於把書完成了。

當自己寫書的時候,才知道一本書產生的過程頗為繁複,不禁對於過去那些對於人類知識有貢獻的教科書作者產生莫名的敬意。

一本程式語言的書、或是類似的教科書,往往是眾多知識的累積與彙整。由於 R 軟體的函數沒有幾千有也上萬,在寫書的過程中,哪些函數該加入、哪些函數該捨棄,往往是花最多時間之處。

(繼續閱讀…)