Simple Linear Regression: R vs. Python

有時候聽到一些人在講 Python 比 R 「更適合」作資料分析或科學計算,我就覺得他們在胡說八道。

買 iPhone 人通常都被別人認為比較有品味,但如果把 iPhone 拿來當鐵鎚,固然能把釘子敲進去,但終究無法證明 iPhone 是適合當鐵鎚,更無法證明 iPhone 比鐵鎚更像鐵鎚。要敲釘子的話,還是拿鐵鎚來當工具比較適當,也比較直接容易。

在這裡,我們不使用 R 跟 Python 的 Regression package/module,純粹比較兩種程式語言「內建(built-in)」的數學與向量計算功能、從理論撰寫出程式的直覺跟簡潔、與程式碼的多寡,計算簡單線性迴歸 (Simple Linear Regression)

(繼續閱讀…)


 

Debian Linux Wheezy 安裝 GTX 1080 GPU 顯示卡 + R 軟體

Linux 核心資訊:Linux debian64 3.2.0-4-amd64

昨天買的 GTX 1080 Turbo OC 8G 顯示卡寄來,於是把之前那張便宜的 GeForce 210 顯示卡換掉,重新開機後進入 R,本來以為之前已經裝好了 Navidia CUDA Toolkit 跟 gpuR, gputools , 結果紛紛出現錯誤訊息,無法執行

於是上網搜尋看看別人在相同的作業系統下安裝 GTX 1080 的經驗,沒想到沒有人裝過

(繼續閱讀…)


 

台灣企業關連式資料庫(RDBM)比例

底下的數字,是我去年年底在東吳城中校區 R 研討會 「R軟體與企業介接的實務方法」 session 其中一個 page. 2016 的數字是 12 月底左右統計的。

這些數字比較有趣的地方,是在最底下:「Hadoop/Spark」 人才徵求的比例 7%。

(繼續閱讀…)


 

R 軟體: xgboost + iris 資料範例

最近在 Kaggle 網站很紅的 xgboost 分類技術,在網路上居然找不到簡單易懂的 R + xgboost + iris 資料檔的範例

多數的人提供的範例都寫得亂七八糟、慘不忍睹,需要再額外花不少時間去理解跟改寫。我常常覺得不少 IT 背景的人在寫 document 或做範例時,經常把簡單的東西搞得非常複雜,大概是認為只要他們自己看得懂即可

所以我整理了以下這個例子,有興趣的朋友們可以 copy 去使用

(繼續閱讀…)